AI 主播來了!產業該怎麼應用?

AI影像與語音生成技術的蓬勃發展,在各個產業掀起不同的應用想像,甚至在音樂產業已出現AI偶像,近期包括俄羅斯、中國、韓國等國家,都可以看見AI主播的身影,並引發討論。台灣新創集仕多Choozmo也成功打造出全台首位虛擬主播「AI Spokesgirl」。

集仕多ChoozMo是目前唯一獲得工業局-人工智慧技術服務機構能量登錄,具虛擬人像技術的廠商,並曾獲選科技部「預見。新創計畫」代表團隊,赴矽谷加速器培訓。

Choozmo創辦人梁哲瑋提到,之所以開發出AI主播的解決方案,主要是為了幫助企業行銷人員與頻道內容經營者能夠快速量產,且不必受限於拍攝影片所必須支付的高昂金錢與時間成本。他指出,雖然影片內容較能吸引閱聽者的目光,在行銷方面,影片的的SEO(搜尋引擎優化,Search Engine Optimization)難度也相較網頁內容優化來得低,但由於影片製作成本相較於圖文內容更高,透過AI主播的解決方案幫助企業或創作者大幅降低影片產製門檻及成本。

Choozmo所開發出的AI虛擬主播,主要作法是使用腳本、照片、影片,甚至簡報檔,再以AI模型生成對應的影像。從主播的面貌、「對嘴」的嘴型,到主播念出來的語音內容,都是使用GAN(Generative Adversarial Network)生成而來。

梁哲瑋說,目前AI虛擬主播可應用的範圍十分廣泛,除了報導是影片,或是導覽、線上課程都是已知的應用。企業也可以利用主播報導的形象,結合公司宣傳內快速產製形象短片;或是可以依照受眾調整AI主播的風格,如客語、日文、泰文等,結合新聞稿與圖片,產出圖文兼具的新聞播報影片,甚至是遠端連線都很適合。

他認為,Choozmo的AI虛擬主播最大的優勢是,能在低成本的情況下,產生出高擬真的人像,且能說出多國語言的影片,不僅省時且彈性高,甚至能做到超解析度,以提升影片解析度品質。如下圖所示。

梁哲瑋認為,企業產製內容影片最大原因在於增加品牌的話語主導權,若能透過大量產製的影片內容的,結合SEO優化,將能吸引更多的外部曝光機會。(文章整理:Celine)

想知道更詳細的AI主播細節,請參考【AI CAFÉ 線上聽】AI 主播 ON Air!以深度學習生成結合人臉與語音