AI合成人臉——你能分辨出哪個小姐姐是真的嗎?

0 評論 10545 瀏覽 3 收藏 11 分鐘

AI合成真假難辨的人臉,在沒看攻略之前,你還能正確地做出分辨嗎?

自 2018 年 12 月英偉達推出?StyleGAN?以來,合成人臉已經讓人難以輕易分辨。特別是今年年初,英偉達開源了 StyleGAN 的代碼,大量真假難辨的人臉被開發者「創造」出來。

近日,有開發者創建了一個網站,讓玩家分辨哪張人臉是真實的。如下圖所示,打開網站地址,就可以直接玩游戲,選擇自己認為的真實人臉。

網站地址:http://www.whichfaceisreal.com/index.php

下面的這些圖你能分辨真假嗎?(答案見文后)

在未看「攻略」之前,小編依靠本能選擇,結果前五輪測試全部錯誤(這運氣也是杠杠的)。但 AI 大牛 Yann LeCun 有妙招。Yann LeCun 在 Twitter 上「傲嬌地」表示,他嘗試了一些測試,全部選擇正確。如果你了解當前的生成模型,就發現圖像中的一些明顯訊號。

其實仔細總結,我們還是會發現生成圖像在細節上有些「痕跡」,而這些「痕跡」就是判別的指南。說不定以后的 GAN能解決掉這些細節,讓生成圖像真正「欺騙」人類。

真假臉怎么做?

在去年的 12 月中,英偉達發布了一種新型 StyleGAN,它生成的圖像極其逼真,如果只看假圖的話基本上都不能確定是不是真的。StyleGAN 的生成器架構借鑒了風格遷移研究,可對高級屬性(如姿勢、身份)進行自動學習和無監督分割,且生成圖像還具備隨機變化(如雀斑、頭發)。

在 2019 年 2 月份,英偉達發布了 StyleGAN 的開源代碼,我們可以利用它生成真實的圖像。在默認情況下,SyleGAN 訓練 1024×1024 分辨率的圖片需要使用 8 塊 GPU 訓練接近一個星期,英偉達研究者在說明文檔中勸告所有使用者:使用較少 GPU 可能無法達到最佳效果。

StyleGAN 官方開源地址:https://github.com/NVlabs/stylegan

StyleGAN 合成的逼真人臉圖像,圖源 Kerras et al.

除了生成對抗網絡的代碼外,英偉達還提供了大量預訓練模型,包括室內、汽車和人臉等,我們可以借助它繞過漫長的訓練過程。對于這個網站所生成的人臉,英偉達提供的預訓練模型是在兩個大型人臉圖像數據集上訓練的,即 CELEBA-HQ 和 FFHQ。其中 CELEBA-HQ 提供數以千計的名人人臉,而 FFHQ 包含發布到?Flickr?的 7 萬多張人臉圖像。

Flickr?FFHQ 數據集上的真實人臉圖像,它們會用來訓練算法

在這個網站中,作者每次展示一對人臉圖像。其中真實人臉選自 FFHQ 數據集,合成人臉由 StyleGAN 系統生成。這些合成人臉圖像同樣展示在網站 thispersondoesnotexist.com 中,該網站每 2 秒展示一張由 StyleGAN 生成的偽造人臉。

真假臉怎么辯?

盡管 StyleGAN 非常出色,且只看合成人臉很難相信它們都是偽造的,但是 StyleGAN 同樣也會留下一些偽造的痕跡,很多痕跡甚至是生成圖像的共性。這些「痕跡」因圖像而異,并不是每一張圖像都有,也不是所有痕跡都比較明顯。但是了解這些技巧后,我們就能快速區分真假人臉,并達到很高的準確率。

水斑

我們并不確定以后的 GAN 是否也會出現這個問題,但是當前 StyleGAN 的一個顯著特點是:它有時會產生一些閃亮的斑點,這些斑點看起來有點像舊照片上的水斑。這個特征很容易幫助我們將其判斷為生成圖像,不過斑點可能會出現在圖像的任何地方,且在頭發和背景的交界處出現的頻率比較高。

背景問題

另一個判斷依據是出現在圖像背景里的各種錯誤,因為背景可能包含豐富的語義信息,只要語義信息不連貫,我們就能斷定它是假的。神經網絡主要用來訓練生成面部,它對背景環境的注意力并沒有那么多。

在最糟的情況下,可能生成的圖像如下第一張所示,旁邊的人非常奇怪。當然也可能如第二張生成一些混亂的形狀或立方體,如第三張生成完全不合理的背景。

眼鏡

到目前為止,生成對抗網絡很難生成逼真的眼鏡。一個常見的問題是生成的眼鏡不對稱,我們只要看看眼鏡的框架結構就能識別出來。很可能左邊的框架會采用一種風格,而右邊的框架又采用另一種風格;也可能框架的邊框產生扭曲或出現鋸齒。

其他不對稱

總的來說,對稱是人臉生成算法面臨的一大挑戰。除了不對稱的眼鏡之外,還要注意左右兩邊臉毛、耳朵、首飾及衣物的不對稱。StyleGAN 表示:我容易么我。

頭發

頭發很難渲染地很逼真。有時臉上或其他部位會有不連貫的頭發(如下面第一張圖所示)。還有些時候頭發可能會太直、有條紋,正如?Kyle?McDonald 所說的,「就像有人用調色刀或一把大刷子弄臟了一塊丙烯酸顏料?!谷缦聢D中間的圖所示。有時頭發周圍會有奇怪的光暈(如下面第三張圖所示)。

Kyle?McDonald 識別生成圖像的經驗:https://medium.com/@kcimc/how-to-recognize-fake-ai-generated-images-4d1f6f9a2842

熒光滲透

一種有趣的現象是,假照片背景里的熒光色彩有時會從背景流到頭發或臉上。

牙齒?

牙齒不容易渲染,假照片里的牙齒通常很奇怪或不對稱。一些照片里的人甚至有三顆門牙(如下面最后一張圖所示)。

照片為真的標志

上面介紹了如何識別假照片,我們已經知道神經網絡難以生成什么事物。如果遇見渲染準確、各方面都做得很好的照片,你就可以很自信地說那是一張真照片。這些方面包括對稱的眼鏡和耳環(下圖第一張)、旁邊有真實無誤的同伴(下圖第二張)以及充滿細節的背景,尤其是旁邊還有可以閱讀的文字(下圖第三張)。

高招

在實際生活中,其實我們可以用一記妙招來可靠地辨別互聯網上生成的人是否為真人。方法很簡單:StyleGAN?算法不能生成同一個「假人」的多張圖像。截至目前,我們還沒聽說過有哪一款軟件可以生成同一個假人多個角度的人像。因此,如果你想確定你在社交網絡上的夢中情人是真人,那就跟他多要幾張照片。如果他能給出一張大頭照和其他照片,那他就是真人。當然,給你發信息的人未必是照片里的人,但照片里的人一定是真人。

軟件總有一天會升級,但現在來看,多張照片仍然是證明真實性的有力證據。

答案:第一張右邊是真的,第二張右邊的是真的,第三張左邊是真的

 

本文由 @CDA數據分析師 翻譯發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!