手機(jī)版 | 網(wǎng)站導(dǎo)航
觀察家網(wǎng) > 熱點 >

周鴻祎:讓通用大模型“走下神壇”,真正進(jìn)入千家萬戶

中國新聞網(wǎng) | 2023-08-09 21:14:26


(相關(guān)資料圖)

中新網(wǎng)北京8月9日電 題:周鴻祎:讓通用大模型“走下神壇”,真正進(jìn)入千家萬戶

中新財經(jīng)記者 夏賓

ISC2023第十一屆互聯(lián)網(wǎng)安全大會9日在京召開,會議期間,360集團(tuán)創(chuàng)始人周鴻祎在接受中新財經(jīng)等媒體采訪時直言,通用大模型熱了一陣之后,大家都在反思通用大模型存在的一些問題。

圖為360集團(tuán)創(chuàng)始人周鴻祎在第十一屆互聯(lián)網(wǎng)安全大會期間接受中新財經(jīng)等媒體采訪?!≈鬓k方供圖。

在周鴻祎看來,通用大模型涉及的問題有兩個方面。一是要真正打造一個超強的“全知全能”的大模型所需要的算力和訓(xùn)練成本都非常高,這對于中國市場而言還需要一點時間。

二是通用大模型對普通用戶使用起來并不太友好,需要用戶變成一個提示詞或者指令專家,在中國要發(fā)展大模型,現(xiàn)階段從國家政策來看,仍應(yīng)圍繞產(chǎn)業(yè)數(shù)字化這一戰(zhàn)略來發(fā)展大模型。

“所以看通用大模型,我提出來走垂直化、產(chǎn)業(yè)化、專業(yè)化、企業(yè)化之路。因為在企業(yè)發(fā)展過程當(dāng)中,有非常多的小場景比較適合大模型,垂直化、產(chǎn)業(yè)化的大模型選擇的場景相對小切口,對于能力要求不一定那么強?!敝茗櫟t解釋說,這甚至有點像偏科生,不一定要求綜合能力很強,如果做這樣的大模型,難度反而會降低,而對于企業(yè)來說可承受的成本代價包括交付時間,也會減少很多。

周鴻祎透露,360正在訓(xùn)練數(shù)字安全大模型,基于其龐大的網(wǎng)絡(luò)安全大數(shù)據(jù),現(xiàn)在要補上真正的深度學(xué)習(xí)的大語言模型能力,讓它從數(shù)據(jù)大腦真正變成智慧大腦。

他認(rèn)為,在安全領(lǐng)域,未來還會有各種各樣的垂直類大模型,就可以解決不同問題。如果垂直類大模型不需要用千億或萬億模型,可能用百億、十億、幾十億模型,這樣模型的整個訓(xùn)練時間、調(diào)試成本、部署成本等大概會比GPT的成本低百倍以上,如此才有可能讓大模型“走下神壇”,讓大模型賦能百行千業(yè)、走進(jìn)千家萬戶,才能真正掀起新一輪工業(yè)革命。(完)

標(biāo)簽:

  • 標(biāo)簽:中國觀察家網(wǎng),商業(yè)門戶網(wǎng)站,新聞,專題,財經(jīng),新媒體,焦點,排行,教育,熱點,行業(yè),消費,互聯(lián)網(wǎng),科技,國際,文化,時事,社會,國內(nèi),健康,產(chǎn)業(yè)資訊,房產(chǎn),體育。

相關(guān)推薦