微軟展示AI合成影片新技術 硬照加錄音「生成」 添表情神態眼神交流
【有線新聞】微軟展示人工智能新技術,只要提供硬照及錄音,人工智能就可合成影片,令相中人開口說話。
片中人獨白:「你知道的,要麼沒事發生,要麼所有事情一起發生,你只能隨遇而安。」這位女士其實沒講過這番說話,聲音甚至不屬於她,片段是由人工智能生成,出自微軟一個研究團隊。只要提供一幅人像硬照,加上任何錄音,AI就會自動將硬照變成影片,令相中人開口說話。
不僅口形跟聲音同步,AI甚至會配上整套表情神態,相中人會眨眼,視線會根據節奏轉變,與鏡頭有適當眼神交流。用家可以加上各種指示,令相中人望左、望右、向上望,或要求不同表情,例如神情比較輕鬆或拘謹都可以。輸入硬照不一定用真人,錄音亦可以採用歌曲,例如想蒙娜麗莎為你高歌一曲也沒問題。
現時已經有AI工具可以用聲音樣本生成出新的說話,如果結合這項技術,樣貌及聲調雖然出自本人,但整個片段及內容都可以偽造,真假完美融合,將令一般人防不勝防。微軟研究人員強調今次只是展示AI的新進展,不會貿然開放予公眾,直到相關法規成熟,才會對外分享這套系統。