123,123,123

Deepfake是一種換臉技術(shù)，可以將圖片或視頻中A的臉換到B的頭上。其名字由深度機(jī)器學(xué)習(xí)(deep machine learning)和假照片(fake photo)組合而成。這項(xiàng)技術(shù)不需要操作者具備深厚的專業(yè)知識(shí)，只要收集到足夠素材，AI就可以完成。Deepfake換臉效果逼真，讓人難以分辨真假，這也引發(fā)了眾多倫理和隱私問(wèn)題。

史泰龍和施瓦辛格兩位好萊塢頂級(jí)流量功夫巨星最近一次合體出現(xiàn)在大銀幕上，還是在2013年上映的《金蟬脫殼》中，這讓不少影迷意猶未盡。11月22日，一篇報(bào)道稱，國(guó)外視頻網(wǎng)站上一部名為《Step Brother》的電影短片，借助Deepfake技術(shù)，把兩位巨星的面部替換到了兩名小眾演員臉上，而且人臉表情自然，毫無(wú)痕跡，這讓不少網(wǎng)友驚嘆：太恐怖。此外，在最近的國(guó)內(nèi)熱播劇《了不起的兒科醫(yī)生》中也使用了這種AI換臉技術(shù)。

根據(jù)安全分析公司Sensity最新調(diào)查結(jié)果，自2018年12月以來(lái)，Deepfake在線造假視頻的數(shù)量大約每6個(gè)月翻一番，而截至2020年6月，造假視頻已經(jīng)多達(dá)49081個(gè)，比2019年7月增長(zhǎng)了330%。

Deepfake技術(shù)讓視頻換臉變得越來(lái)越簡(jiǎn)單，如何打假“李鬼”，讓其避免成為假視頻的“幫兇”已成為當(dāng)務(wù)之急。

用視頻“大變活人”分幾步

Deepfake這種技術(shù)堪稱現(xiàn)代網(wǎng)絡(luò)“易容術(shù)”，是比PS強(qiáng)大很多的動(dòng)態(tài)換臉技術(shù)。“目前Deepfake技術(shù)已經(jīng)很成熟了，主要技術(shù)分為兩個(gè)部分，自動(dòng)編碼器和生成對(duì)抗網(wǎng)絡(luò)。”天津大學(xué)智能與計(jì)算學(xué)部教授翁仲銘介紹。

自動(dòng)編碼器是一種神經(jīng)網(wǎng)絡(luò)技術(shù)，就是把一個(gè)人的照片特征抓取出來(lái)，然后用數(shù)字代表。但是抓取一個(gè)人的面部特征時(shí)，不可能抓取所有狀態(tài)下的特征，比如說(shuō)話、哭和笑等，那么就必須將沒(méi)有的表情用數(shù)字模擬的方式展現(xiàn)出來(lái)。通過(guò)訓(xùn)練，就可以找出一個(gè)最好的用數(shù)學(xué)方式來(lái)呈現(xiàn)照片特征的編碼器。

有編碼器就需要解碼器，解碼器會(huì)把一串串?dāng)?shù)字再還原成照片。不同解碼器可以在演員身上還原不同照片，比如史泰龍解碼器可以還原史泰龍照片，而還原施瓦辛格照片則需要施瓦辛格的解碼器。具體操作是先使用編碼器分別抽取小眾演員和史泰龍的特征，而后再使用史泰龍的解碼器還原，從而得到史泰龍的臉和小眾演員的表情。

“Deepfake就是在設(shè)計(jì)、訓(xùn)練精準(zhǔn)的編碼器和解碼器。”翁仲銘介紹，因?yàn)榫幋a器是抓取照片的特征，所以基本上只需要一套就可以了。可是解碼器就需要訓(xùn)練很久，因?yàn)榘岩贿B串的數(shù)字特征，拼接到小眾演員身上，而且要變得很像，就需要長(zhǎng)時(shí)間訓(xùn)練。以換成史泰龍的臉為例，這個(gè)過(guò)程需要輸入史泰龍600—3000張照片并經(jīng)過(guò)48—72小時(shí)來(lái)訓(xùn)練深度模型。

“自動(dòng)編碼器做出的照片是否自然真實(shí)還需要去判別把關(guān)，這就需要生成對(duì)抗網(wǎng)絡(luò)技術(shù)。”翁仲銘解釋，這包括兩個(gè)機(jī)器學(xué)習(xí)模型，分別為生成網(wǎng)絡(luò)和辨別網(wǎng)絡(luò)。生成網(wǎng)絡(luò)扮演“造假者”，在模型訓(xùn)練后產(chǎn)生偽造影片;而辨別網(wǎng)絡(luò)則扮演“檢測(cè)者”，不斷地檢視假影片，直至它再辨別不了結(jié)果是假的。數(shù)據(jù)越多，效果越理想，假影片越真實(shí)。

換臉門檻越來(lái)越低

其實(shí)這種動(dòng)態(tài)換臉技術(shù)最早是被用于影視后期制作，但是以前影視作品中的人臉交換操作起來(lái)非常復(fù)雜，只有專業(yè)視頻剪輯師和公共網(wǎng)關(guān)接口專家才能完成，并且需要花費(fèi)大量時(shí)間和精力。

但隨著Deepfake這樣公開(kāi)且輕量化技術(shù)的出現(xiàn)，這個(gè)技術(shù)的使用門檻也越來(lái)越低了。特別是設(shè)計(jì)架構(gòu)Deepfake技術(shù)的“大神”將代碼上傳到了一個(gè)自由共享代碼的網(wǎng)站Github，讓這項(xiàng)技術(shù)更容易獲得。

利用Deepfake技術(shù)，即使是一個(gè)對(duì)視頻剪輯一竅不通的外行，也只需一個(gè)強(qiáng)大的GPU(圖形處理器)和上百?gòu)埲宋飿訄D，輸入至少一個(gè)算法，就能完成人臉交換，并且可以制作出非常逼真的視頻效果。“普通人在經(jīng)過(guò)一段時(shí)間的學(xué)習(xí)以后，完全能夠掌握這項(xiàng)技術(shù)。”翁仲銘感嘆。

“雖然現(xiàn)在這項(xiàng)技術(shù)操作起來(lái)簡(jiǎn)便，但是原來(lái)要用軟件實(shí)現(xiàn)這個(gè)過(guò)程是非常艱難的。”翁仲銘解釋，視頻中人是動(dòng)態(tài)的，比如一個(gè)60幀(fps)的視頻中，每秒鐘畫面更新60次，如果是PS的話需要處理60張靜態(tài)圖片，然后將其前后連接起來(lái)形成一個(gè)動(dòng)態(tài)圖。一個(gè)短視頻動(dòng)輒數(shù)分鐘，甚至十多分鐘，如果按照一分鐘處理3600張計(jì)算，一個(gè)幾分鐘的短片也要處理多達(dá)上萬(wàn)張照片，所以需要強(qiáng)大算力的GPU來(lái)支撐。

翁仲銘認(rèn)為，近些年隨著GPU的發(fā)展，其算力越來(lái)越強(qiáng)大，也使得Deepfake技術(shù)處理照片越來(lái)越輕松，使用越來(lái)越方便。這可能也是2018年12月以來(lái)，造假視頻成倍增長(zhǎng)的原因之一。

以技制技打假“李鬼”還不夠

如此強(qiáng)大的“黑科技”采用了最先進(jìn)的人工智能技術(shù)，通過(guò)比較簡(jiǎn)單的運(yùn)算，就有可能生成以假亂真的視頻。但是Deepfake技術(shù)在運(yùn)行幾天之后，就遭到了唾棄，被全球封禁，還被世人稱為“最邪惡”的技術(shù)。

因?yàn)樘^(guò)以假亂真，其破壞力不可估量。事實(shí)證明，人們的擔(dān)心并非杞人憂天。Deepfake第一次亮相就是將《神奇女俠》蓋爾·加朵的臉，嫁接到了一部成人電影女主角身上。此外由Deepfake制作的假視頻已引發(fā)多起刑事案件，甚至卷入政治紛爭(zhēng)。

不過(guò)再完美的技術(shù)也不是無(wú)懈可擊的，專家們提出了幾種辨識(shí)Deepfake換臉視頻的方法：比如眨眼率，通過(guò)Deepfake制作的對(duì)象的眨眼率少于正常人;語(yǔ)音和嘴唇運(yùn)動(dòng)的同步狀況;情緒不符合;模糊的痕跡、畫面停頓或變色。不過(guò)翁仲銘表示，這些方法，Deepfake通過(guò)加強(qiáng)對(duì)樣本的學(xué)習(xí)，都可以解決，遲早會(huì)有人可以通過(guò)Deepfake技術(shù)制造出人類用肉眼無(wú)法識(shí)別的“假臉”。

“也有不少人想到以AI對(duì)抗AI。”翁仲銘介紹，美國(guó)國(guó)防部研發(fā)了全球首款“反AI變臉刑偵檢測(cè)工具”，專門用于檢測(cè)AI變臉或換臉造假技術(shù)。不過(guò)，人工智能基金會(huì)的研究副主席戴利普承認(rèn)，現(xiàn)時(shí)Deepfake檢測(cè)算法的準(zhǔn)確率，即使可高達(dá)97%，但鑒于互聯(lián)網(wǎng)規(guī)模非常大，余下的3%仍然極具破壞力。

目前還有一個(gè)識(shí)別Deepfake換臉的新思路，叫作“活體取證”，該技術(shù)主要是根據(jù)分辨率、三維信息、眼動(dòng)等來(lái)區(qū)分真假，因?yàn)榉牡恼掌直媛屎椭苯訌恼嫒松喜杉恼掌谫|(zhì)量、分辨率上比都有差別。

“整個(gè)算法遵循的觀察規(guī)律是：生物信號(hào)還沒(méi)有保存在假視頻中，這些信號(hào)在生成噪聲時(shí)也產(chǎn)生了不同的標(biāo)識(shí)。”翁仲銘解釋，換句話說(shuō)，假視頻中顯示的“人”不會(huì)表現(xiàn)出與真實(shí)視頻中的人相似的心跳模式，通過(guò)這種方法可以找到每個(gè)生成模型的唯一簽名(標(biāo)識(shí))。值得一提的是，無(wú)論遮擋、照明條件如何變化，這些標(biāo)識(shí)在真實(shí)視頻中是不存在的。利用這些標(biāo)識(shí)可以找到假視頻背后的生成模型，然后反過(guò)來(lái)提高整體的假視頻檢測(cè)精度。

“道高一尺魔高一丈，利用Deepfake技術(shù)的人也在不斷改進(jìn)換臉的水平，因此從長(zhǎng)遠(yuǎn)來(lái)看，我們必須尋求更有力的方法來(lái)維護(hù)和證明社交媒體信息的真實(shí)性。目前幾乎沒(méi)有任何工具可以幫助讀者確信其在網(wǎng)上看到的信息來(lái)源可靠，且沒(méi)有被篡改。”翁仲銘強(qiáng)調(diào)，改善這種情況需要從視頻發(fā)布源頭進(jìn)行管理，比如實(shí)名制，同時(shí)加強(qiáng)立法，增加網(wǎng)絡(luò)警察巡邏等，嚴(yán)厲打擊這種造假行為。(記者陳曦)

Deepfake技術(shù)被稱現(xiàn)代網(wǎng)絡(luò)“易容術(shù)” AI換臉如何打假“李鬼”