首頁 > 技術(shù) > 正文

英特爾以強大產(chǎn)品力,迎接生成式AI的廣闊機遇|熱聞

2023-03-31 15:47:21來源:中關(guān)村在線  

生成式AI能夠模仿人類生成的內(nèi)容,在改變我們工作和生活方式的諸多方面提供了一個令人興奮的機會。然而,這種快速演進的技術(shù)也揭示出,在數(shù)據(jù)中心成功利用AI需要極其復雜的計算。

英特爾面向未來進行了大量投資,希望每個人都能利用這項技術(shù),并能輕松進行大規(guī)模部署。同時,英特爾正與產(chǎn)業(yè)伙伴接洽,以支持一個基于信任、透明和多種選擇的開放式AI生態(tài)系統(tǒng)。

擁抱具有卓越性能的開源生成式AI


【資料圖】

生成式AI例如GPT-3和DALL-E等語言模型已經(jīng)存在一段時間了,但ChatGPT(一種可以進行類似人類對話的生成式AI聊天機器人)則引發(fā)巨大轟動,讓人們開始關(guān)注傳統(tǒng)數(shù)據(jù)中心架構(gòu)的瓶頸。ChatGPT還加快了對硬件和軟件解決方案的需求,這些解決方案使AI能夠充分發(fā)揮其潛力。基于開放方法和異構(gòu)計算的生成式AI使其更容易獲得,并更經(jīng)濟地部署最優(yōu)的解決方案。開放生態(tài)系統(tǒng)允許開發(fā)人員在優(yōu)先考慮功耗、價格和性能的同時,隨時隨地構(gòu)建和部署AI,從而釋放生成式AI的力量。

網(wǎng)絡(luò)研討會:英特爾將舉辦數(shù)據(jù)中心和人工智能事業(yè)部投資者網(wǎng)絡(luò)研討會

英特爾正在積極采取措施,并通過優(yōu)化主流的開源框架、庫和工具來實現(xiàn)出色的硬件性能,同時消除復雜性,來確保自身是實現(xiàn)生成式AI的明智選擇。近日,頂級機器學習開源庫Hugging Face發(fā)布的結(jié)果顯示了英特爾AI硬件加速器卓越的推理運行速度,該結(jié)果基于對包含1760億個參數(shù)的BLOOMZ模型(一種基于轉(zhuǎn)換器的多語言大型語言模型(LLM)和包含70億參數(shù)的較小BLOOMZ模型進行推理。其中,對于包含70億參數(shù)的較小BLOOMZ模型,Habana第一代Gaudi具有明顯的性價比優(yōu)勢。此外,Hugging Face Optimum Habana庫簡化了大型LLM的部署,用戶僅需對代碼進行極小的修改。

英特爾研究院的研究人員還使用Habana Gaudi2在LMentry(一種最近提出的語言模型基準)零次學習設(shè)置下評估BLOOMZ。BLOOMZ的精度與GPT-3模型尺寸相似,如下圖所示,最大的176BBLOOMZ模型的性能優(yōu)于類似大小的GPT-3模型。

在100K LMentry提示上,BLOOMZ模型(最多1760億個參數(shù))使用HabanaGaudi加速器對生成的語言輸出進行的自動評估。

此外,Hugging Face亦介紹了Stability AI的Stable Diffusion,這是另一個用于從文本生成圖像的最先進生成式AI模型之一,也是流行的 DALL-E圖像生成器的開放訪問替代方案,Stable Diffusion在內(nèi)置英特爾®高級矩陣擴展(英特爾AMX)的第四代英特爾至強可擴展處理器上運行的平均速度提高了3.8倍。這種加速是在不更改任何代碼的情況下實現(xiàn)的。此外,通過使用英特爾Extension for PyTorch with Bfloat16(一種用于機器學習的自定義格式),自動混合精度可以再提速一倍,并將延遲減少到5秒——比初始基線32秒快了近6.5倍。用戶可在HuggingFace網(wǎng)站上一個基于英特爾CPU(第四代至強處理器)的實驗性Stable Diffusion演示中進行自行嘗試。

Stability AI創(chuàng)始人兼首席執(zhí)行官Emad Mostaque表示:“在Stability AI,我們希望讓每個人都能構(gòu)建自己的AI技術(shù)。英特爾已經(jīng)使Stable Diffusion模型能夠高效運行在他們的異構(gòu)產(chǎn)品上——從第四代Sapphire Rapids CPU一直到像Gaudi這樣的加速器,因此是實現(xiàn)AI民主化的一個絕佳合作伙伴。我們期待在下一代語言、視頻和代碼模型等方面與他們合作?!?/p>

OpenVINO進一步加速了Stable Diffusion推理。結(jié)合使用第四代至強CPU,它的速度幾乎比第三代英特爾至強®可擴展CPU提高了2.7倍。Optimum Intel是OpenVINO支持的一個工具,用于加速英特爾架構(gòu)上的端到端管道,它將平均延遲再降低3.5倍,總共降低近10倍。

解決價格、性能和效率問題

此外,為滿足減少用電量的關(guān)鍵需求及不斷增長的性能需求,還需要提供更加可持續(xù)的解決方案。一個開放的生態(tài)系統(tǒng)可以消除阻礙進步的障礙,使開發(fā)人員能夠在每一項工作中都能夠使用最好的硬件和軟件工具進行創(chuàng)新。

Gaudi2與第一代Gaudi構(gòu)建在相同的高效架構(gòu)上,可助力大規(guī)模工作負載的性能和效率達到全新高度,并在運行AI工作負載時展現(xiàn)出強大的能效優(yōu)勢。

大規(guī)模AI工作負載還需要達到“一次構(gòu)建、隨處部署”方式,這種方式基于靈活、開放的解決方案,能夠?qū)崿F(xiàn)更好的能效。第四代至強處理器是英特爾最具可持續(xù)性的數(shù)據(jù)中心處理器,有著更高的能效和節(jié)能效果。憑借英特爾AMX這樣的內(nèi)置加速器,在廣泛的AI工作負載和使用案例中,推理和訓練性能可提高10倍,同時其每瓦性能相較英特爾前代產(chǎn)品最多可提升14倍3。

英特爾(Intel) i5-12400F 12代 酷睿 CPU處理器 6核12線程 單核睿頻至高4.4Ghz 10400F迭代升級款

[經(jīng)銷商]京東商城

[產(chǎn)品售價]¥1349元

進入購買

標簽:

相關(guān)閱讀

精彩推薦

相關(guān)詞

推薦閱讀