作者 美圖君
相信你已經在網上見過各式各樣的 deepfake 換臉技術了。
比如,這些奧巴馬里,哪個是真的?
其實,他們都是假的。他們是南加州大學創意技術研究所(USC Institute for creative technologies)的人工智能學家 Supasorn Suwajanakorn 用美國前總統里根的嘴部動作和奧巴馬的臉合成的。
這種換臉技術,就叫做 deepfake。
一般來說,deepfake 技術需要大量的訓練集數據,也就是本人的學習資料才能做出看起來可信的結果。但是最近,位于莫斯科的三星人工智能研究所的科學家們推出了一種只要幾張圖片,就能還原3D人臉動態的技術。
下面這些圖片里,左邊是輸入的單張圖片,右邊是 AI 輸出的動圖。
在這項技術中,研究人員使用了3個 AI。
第一個 AI 捕捉 landmark,也就是面部關鍵特征點,比如臉的形狀,眼睛的位置等,并把它們轉化為向量。
第二個 AI 負責把這些向量轉化為視頻。
第三個 AI 把第二個 AI 做出來的結果和原圖片進行對比和評估。
利用這3個AI,只需要幾張本人的圖片就能實現人物動態的“腦補”,可以生成原圖片中沒有的角度。
當然,輸入圖片越多,得到的效果就越逼真。
從下面的圖片中你可以看到,用32張圖片訓練得到的動態圖比只用一張圖片得到的效果瑕疵更少。但是,只用一張圖片就能還原人的全臉動態效果,效果已經很不錯了。
下面的這些說話的明星人頭動圖,哪些是真的,哪些是 AI 造出來的呢,你能分得清嗎?
其實,它們都是機器造的,每個動圖用的僅僅是8張圖片。利用這個技術,可以輕松把單張自拍圖變成動態圖。
用名人的一張相片,也可以“腦補”出動態圖。
被玩壞的瑪麗蓮夢露——
達利——
陀思妥耶夫斯基——
愛因斯坦——
用來腦補名畫也不錯。
伊凡·克拉姆斯柯依的《無名女郎》——
蒙娜麗莎——
這種技術相當于把照片變成了傀儡,動作本身是別人的。因此你可以看到,用3個不同的人的面部動態還原的蒙娜麗莎,效果有很大區別。
總之看完這3個不同的人設,我心中已經默認蒙娜麗莎本人應該長成中間那個顏藝擔當的版本,并且開始拒絕蒙娜麗莎本來的樣貌。在這個星球上,臉盲星人的生存實為不易啊。
達特茅斯學院的計算機科學教授 Hany Farid 認為,這些技術很難不被濫用,“這是技術的另一種演化方向,以后可能會出現和真實拍攝的多媒體內容傻傻分不清的全人造視頻?!?/p>
前面提到的制造出奧巴馬 deepfake 視頻的南加州大學研究者 Suwajanakorn 本人也明白 deepfake 被濫用的可能性以及殺傷力,因此自己參與了鑒定影像真實性的工具的研發。如果你對視頻或者圖片的真實性有所懷疑,可以用他的 Reality Defender 插件進行鑒定。
其實,沒那么高端的換臉技術早在網紅屆泛濫了。憑借現在的濾鏡,就可以把隨便一個路人變成下巴尖到能戳死人的網紅。Deepfake 濾鏡成熟以后,通過手機或許就可以變身任何一個明星,假借明星的臉說出你想說的話,做你想做的事。
好了,下次奧巴馬邀請你視頻聊天,并向你借錢的時候,你知道該怎么做了吧。