手機(jī)版 | 網(wǎng)站導(dǎo)航
觀察家網(wǎng) > 科技 >

馬斯克發(fā)布新一代AI模型Grok 3

科技日?qǐng)?bào) | 2025-02-20 11:38:26

北京時(shí)間18日中午,美國(guó)企業(yè)家埃隆·馬斯克創(chuàng)辦的人工智能公司xAI推出了新一代AI模型Grok 3,馬斯克稱(chēng)其“聰明得可怕”。Grok 3擁有更高的推理、計(jì)算和適應(yīng)能力,代表著AI模型向前邁出重要一步。

馬斯克在直播演講中表示:“Grok 3的能力比Grok 2高出一個(gè)數(shù)量級(jí),它是一種最大程度尋求真相的人工智能。”

xAI公司稱(chēng),Grok 3在包括AIME(評(píng)估模型在數(shù)學(xué)問(wèn)題樣本上的表現(xiàn))和GPQA(博士專(zhuān)家水平的物理、生物和化學(xué)問(wèn)題評(píng)估模型)在內(nèi)的基準(zhǔn)測(cè)試中勝過(guò)了GPT-4o。

更準(zhǔn)確地說(shuō),Grok 3代表一個(gè)模型系列,而非單一的模型型號(hào)。xAI公司表示,Grok 3的推理模型處于測(cè)試階段(Beta版),并且仍在訓(xùn)練中。該公司推出了推理模型的迷你版本,即Grok 3 mini,它可以更快地回答問(wèn)題,但準(zhǔn)確性可能不高。

此外,Grok 3還引入了“DeepSearch”,該公司稱(chēng)其為一種新型搜索引擎,同時(shí)也是類(lèi)似代理功能的早期版本。

原計(jì)劃在此次發(fā)布中推出的語(yǔ)音模式并未如期上線,馬斯克稱(chēng)其最快將在大約一周后推出。幾個(gè)月后,當(dāng)Grok 3模型成熟之時(shí),xAI將開(kāi)源Grok 2。

據(jù)xAI此前報(bào)告稱(chēng),其僅用8個(gè)月時(shí)間打造的Colossus超級(jí)計(jì)算機(jī)加速了Grok 3的開(kāi)發(fā)進(jìn)程。該系統(tǒng)搭載了10萬(wàn)臺(tái)英偉達(dá)H100 GPU,提供了2億GPU小時(shí)的訓(xùn)練時(shí)長(zhǎng),相較其前身Grok 2提升了10倍。算力的顯著提升使Grok 3能高效處理大型數(shù)據(jù)集,縮短訓(xùn)練時(shí)間并提高準(zhǔn)確性。xAI還表示,已在Grok 3中引入人類(lèi)反饋循環(huán)和情境訓(xùn)練,從而確保其回答更加自然和準(zhǔn)確。

為了增強(qiáng)Grok 3的能力,xAI還調(diào)整了訓(xùn)練方法。現(xiàn)在,該模型通過(guò)整合合成數(shù)據(jù)集、引入自我校正機(jī)制和強(qiáng)化學(xué)習(xí),來(lái)全面提升性能表現(xiàn)。據(jù)xAI方面和馬斯克介紹,這些改進(jìn)將通過(guò)多重驗(yàn)證步驟減少錯(cuò)誤回答(即“幻覺(jué)”現(xiàn)象),通過(guò)核對(duì)可靠信息源來(lái)提高邏輯準(zhǔn)確性,并通過(guò)持續(xù)自我評(píng)價(jià)和學(xué)習(xí)實(shí)現(xiàn)更有效的適應(yīng)。

標(biāo)簽:

  • 標(biāo)簽:中國(guó)觀察家網(wǎng),商業(yè)門(mén)戶(hù)網(wǎng)站,新聞,專(zhuān)題,財(cái)經(jīng),新媒體,焦點(diǎn),排行,教育,熱點(diǎn),行業(yè),消費(fèi),互聯(lián)網(wǎng),科技,國(guó)際,文化,時(shí)事,社會(huì),國(guó)內(nèi),健康,產(chǎn)業(yè)資訊,房產(chǎn),體育。

相關(guān)推薦