2019年3月3日,全球首個(gè)AI合成女主播“新小萌”正式上崗新華社,而她的第一個(gè)工作任務(wù),便是參與到當(dāng)下最熱門(mén)的十三屆全國(guó)人大二次會(huì)議(后文簡(jiǎn)稱(chēng)兩會(huì))報(bào)道中。對(duì)此,“今日俄羅斯”電視臺(tái)網(wǎng)站、英國(guó)Daily Mail、美國(guó)Futurism等海外媒體進(jìn)行了大幅報(bào)道,并表示“近年來(lái),中國(guó)已成為全球領(lǐng)先的人工智能發(fā)展中心之一”。
作為第一個(gè)登上兩會(huì)的AI合成女主播,人們?cè)隗@嘆和稱(chēng)贊之余,對(duì)于其背后由搜狗所開(kāi)發(fā)的人工智能技術(shù)都無(wú)比好奇:這個(gè)在鏡頭前播報(bào)新聞的“新小萌”,是如何誕生的呢?它未來(lái)又將有哪些應(yīng)用價(jià)值呢?
什么是AI合成主播?
比起機(jī)器千篇一律的冰冷面孔,用戶(hù)期待的是一個(gè)有溫度的真人形象。所謂AI合成主播,顧名思義,指的就是依靠搜狗的“分身”技術(shù),來(lái)模擬出一個(gè)類(lèi)似人類(lèi)的AI主播進(jìn)行播報(bào)。搜狗的這款產(chǎn)品就是以新華社主播屈萌為原型,她不僅會(huì)用和真人一樣的聲音進(jìn)行播報(bào),就連唇形、面部表情也能完全吻合。從新華社的新聞播報(bào)視頻來(lái)看,栩栩如生的AI合成女主播“新小萌”,在鏡頭前的形象與真人主播幾乎沒(méi)有什么區(qū)別。
AI合成主播在2018年的互聯(lián)網(wǎng)大會(huì)期間首次亮相,就引起了網(wǎng)絡(luò)上的一片熱議,被國(guó)內(nèi)外諸多媒體進(jìn)行報(bào)道。2019年2月21日,AI合成主播宣布再次升級(jí),從過(guò)去的“坐著播新聞”升級(jí)成結(jié)合肢體動(dòng)作的“站立式播報(bào)”,進(jìn)一步提升了合成主播的表現(xiàn)力,保持了搜狗在這一領(lǐng)域的全球領(lǐng)先。本次首個(gè)AI合成女主播參與兩會(huì)報(bào)道,更是成為了中國(guó)人工智能與傳媒業(yè)大膽融合并付諸規(guī)?;瘧?yīng)用的典型案例。
首個(gè)AI合成女主播的背后,有哪些搜狗的“黑科技”?
作為開(kāi)發(fā)AI合成主播的基礎(chǔ),“搜狗分身”是搜狗人工智能的核心技術(shù)之一,誕生于搜狗“自然交互+知識(shí)計(jì)算”這一人工智能理念之下,它能通過(guò)人臉關(guān)鍵點(diǎn)檢測(cè)、人臉特征提取、人臉重構(gòu)、唇語(yǔ)識(shí)別、情感遷移等多項(xiàng)前沿技術(shù),并結(jié)合語(yǔ)音、圖像等多模態(tài)信息進(jìn)行建模訓(xùn)練后,生成與真人無(wú)異的AI分身模型,進(jìn)而幫助人類(lèi)提高信息表達(dá)和傳遞的效率。
得益于前沿技術(shù)的加持,AI合成主播前期只需經(jīng)過(guò)少量的數(shù)據(jù)訓(xùn)練,就能呈現(xiàn)與真人相差無(wú)幾的播報(bào)狀態(tài),同時(shí)還支持個(gè)性化定制,滿(mǎn)足用戶(hù)的不同需求。AI合成主播不僅可以將新聞稿快速地轉(zhuǎn)變?yōu)椴?bào)視頻,還能快速學(xué)習(xí)用戶(hù)音色、韻律、情感等多維度特征,妥善處理聲調(diào)起伏、語(yǔ)言風(fēng)格、情感韻律等,并提供全天候不間斷的播報(bào)服務(wù),極大地提高廣電行業(yè)的傳播效率。
隨著“搜狗分身”技術(shù)能力的不斷提高,AI主播的定制周期也大為降低,合成效果和穩(wěn)定性也有著顯著提升。僅靠少量用戶(hù)真實(shí)音視頻數(shù)據(jù),即可快速定制出高逼真度的分身模型。本次在新華社兩會(huì)報(bào)道中驚艷亮相的首個(gè)AI合成女主播,正是“搜狗分身”技術(shù)持續(xù)復(fù)制不同類(lèi)型、不同特點(diǎn)AI合成主播能力的一個(gè)有力體現(xiàn)。
為不同職業(yè)賦能,搜狗分身的未來(lái)遠(yuǎn)不止于主播
在兩會(huì)期間,AI合成女主播的首次登場(chǎng)亮相,即引發(fā)了媒體和網(wǎng)友關(guān)于主播行業(yè)的激烈討論,可見(jiàn)當(dāng)科技融入到生活后所帶來(lái)的沖擊感是非同凡響的。宛如科幻大片一般的場(chǎng)景,正在逐步成為現(xiàn)實(shí)。和真人主播相比,通過(guò)“搜狗分身”技術(shù)打造的AI合成主播能夠不知疲倦地工作24小時(shí),同時(shí)還掌握多國(guó)語(yǔ)言,大大提升了效率、降低了成本。
然而,AI合成主播僅僅只是一個(gè)開(kāi)始。伴隨著人工智能技術(shù)的不斷升級(jí),個(gè)性化內(nèi)容生產(chǎn)的門(mén)檻大為降低,應(yīng)用范圍愈發(fā)廣泛。未來(lái),“搜狗分身”技術(shù)還將應(yīng)用于娛樂(lè)、醫(yī)療、健康、教育、法律、金融等多個(gè)領(lǐng)域,通過(guò)提供個(gè)性化的行業(yè)解決方案,為不同場(chǎng)景展開(kāi)賦能。根據(jù)不同場(chǎng)景而創(chuàng)造出虛擬教師、虛擬客服、虛擬管家、虛擬醫(yī)生等職業(yè),深度參與到人類(lèi)的內(nèi)容表達(dá)和信息傳遞場(chǎng)景之中,提供服務(wù)并發(fā)揮更多價(jià)值。屆時(shí),各行各業(yè)都將迎來(lái)AI技術(shù)下的新一輪變革。