換臉照怎麼做的?當紅Faceapp背後AI技術大解析

文|台灣人工智慧科技基金會工程師

你也被朋友的異性打扮照洗版了嗎?原本帥氣逼人的男性突然變成了長髮正妹;又或者容貌秀氣的女孩突然成了落腮鬍滿佈的大叔,還有許多男性政治名人也被網友KUSO作圖,引發網友轉發及討論,也讓製作這些「性別轉換」圖片的手機應用程式再度爆紅。這款名為faceApp的「換臉」手機應用程式,能將圖片的人物臉部特徵做性別變換,甚至連髮型、表情、妝容....等等都能夠改變,而這些竟然透過AI演算法就能達到,我們將揭密背後的AI演算法原理。

faceapp的黑魔法:GAN

Faceapp使用的AI技術基底,其實是個被稱為「GAN」的深度學習演算法。GAN的中文譯名為「生成對抗網絡」,顧名思義可用來「生成」資料,搭配大量的訓練資料,GAN能夠學習到資料中的特性,並產生看似真實的「假資料」,例如提供大量人物肖像作為訓練資料,GAN就能學習到人物的圖片特徵,並產生栩栩如生的假人物肖像。

讓我們用白話一點的方式來理解基礎的GAN:

GAN的架構是由一個學徒,與一個導師所組成。學徒負責畫出圖片,而導師負責評論,評判學徒畫出的圖是否足夠真實且令人信服。

一開始,學徒畫出的成果可能不夠真實,但隨著繪畫經驗越來越多,成品也逐漸變好。

學徒不斷地看著大量人物圖片且持續畫出,直到導師覺得足夠「真實」為止

最後,學徒所畫出的人物肖像已經能夠以假亂真

看完GAN的簡略介紹,我們來看看Faceapp的技術與應用目的。Faceapp主要是對使用者提供的人物圖片,針對人物五官等特徵稍加改變,讓其看起來性別有所不同,例如將男性的五官特徵修改到看起來像女性;而女性圖片則修改其五官特徵到像男性。

faceapp將輸入的人臉線條進行調整,使人物變成異性

如上圖,原本的五官線條差異不大,但在人物眼睛的部分加上一點改變,如眼線,原本的男性看起來就像女性了

除了換臉,GAN還能換聲音:

看到這裡,是否對這樣的技術大為驚嘆呢?其實,近年來GAN所受到的關注越來越熱烈,除了faceapp的年齡轉換、性別轉換等圖片轉換的應用,GAN還可以廣泛應用在各個領域,以下是一些實例:

圖像超解析

隨著時代的演進,大家越來越講究圖片的畫質,也因此在超解析度上有了新的作法,目標是把低畫質的圖片變成高畫質的圖片。


模糊的圖片(左圖),經過超解析後成為中間的樣貌,比對於原圖(右圖)《Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network》

文本生成圖像

除了圖像上的轉換,甚至可以給一段文字描述,讓GAN畫出相對應的圖像。

《StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks》

去除圖像中的物件

GAN在多媒體製作產業的重要性正在提升,過去在網路上很紅的「幫我把後面的人去掉」,透過AI技術的演進也變成許多影像編修軟體的內建功能,成為影像工作人員的一大助力。


使用GAN將圖片中的人物去除,並且填補背景《AI image video generation through GANish algorithms》

音訊產生

除了圖像以外,GAN也被用來產生音訊,過去在知名卡通柯南中出現的「變聲領結」,也能透過GAN真實呈現。有興趣的朋友,可以看看台灣人工智慧學校工程師團隊的專案成果《我想當柯南》,如何將GAN應用於聲音轉換。

別害怕被取代,與AI協作將成趨勢

我們可以看到GAN的應用十分多元,但要如何運用這項技術仍得依賴人類的創意與專業知識。隨著科技日新月異,AI的技術也發展得越來越進步與快速,此後勢必將深深影響或改變各產業的既有流程。因此,不論是什麼崗位,都得開始認識人工智慧的相關知識,並開始思考如何善用這個工具,釋放自己的大腦與雙手,做更有價值的工作。未來,有著AI知識的人士,也將藉由AI革新自己身處的領域。