首頁 > 技術(shù) > 正文

谷歌AI研究:距離1000種語言模型更進(jìn)一步|當(dāng)前看點(diǎn)

2023-03-08 06:41:20來源:中關(guān)村在線  


【資料圖】

當(dāng)微軟和谷歌為誰的人工智能聊天機(jī)器人更好而大動(dòng)干戈時(shí),這并不是機(jī)器學(xué)習(xí)和語言模型的唯一用途。除了傳聞中計(jì)劃在今年的年度I/O活動(dòng)中展示20多種由人工智能驅(qū)動(dòng)的產(chǎn)品外,谷歌正在朝著建立一個(gè)支持1000種不同語言的人工智能語言模型的目標(biāo)邁進(jìn)。在周一發(fā)布的更新中,谷歌分享了有關(guān)通用語音模型(USM)的更多信息,谷歌將這一系統(tǒng)描述為實(shí)現(xiàn)其目標(biāo)的 "關(guān)鍵第一步"。

去年11月,該公司宣布其計(jì)劃創(chuàng)建一個(gè)支持全球1000種最常用語言的語言模型,同時(shí)還披露了其USM模型。谷歌將USM描述為 "一個(gè)最先進(jìn)的語音模型系列",它有20億個(gè)參數(shù),在1200萬小時(shí)的語音和超過300種語言的280億個(gè)句子中進(jìn)行訓(xùn)練。YouTube已經(jīng)使用USM來生成封閉式字幕,它還支持自動(dòng)語音識(shí)別(ASR)。這可以自動(dòng)檢測和翻譯語言,包括英語、普通話、阿姆哈拉語、宿務(wù)語、阿薩姆語等等。

現(xiàn)在,谷歌說USM支持超過100種語言,并將作為 "基礎(chǔ) "來建立一個(gè)更加廣泛的系統(tǒng)。Meta公司正在開發(fā)一個(gè)類似的人工智能翻譯工具,目前仍處于早期階段。你可以在谷歌發(fā)布的研究論文中閱讀更多關(guān)于USM和它如何工作的信息。

該技術(shù)的一個(gè)目標(biāo)可能是在增強(qiáng)現(xiàn)實(shí)的眼鏡內(nèi),就像谷歌去年在I/O活動(dòng)中展示的概念一樣,能夠檢測并提供實(shí)時(shí)翻譯,就在你眼前出現(xiàn)。不過,這項(xiàng)技術(shù)似乎還有點(diǎn)遙遠(yuǎn),谷歌在I/O大會(huì)期間對(duì)阿拉伯語的錯(cuò)誤表述證明了它是多么容易出錯(cuò)。

標(biāo)簽:

相關(guān)閱讀

精彩推薦

相關(guān)詞

推薦閱讀