Google推新AI模型 生成影片實現「音畫同步」
【有線新聞】AI影片生成技術近年不斷突破,Google最新推出的模型更可高度結合畫面和聲音,實現「音畫同步」,人物對話變得自然,但真假難辨的問題可能加劇。
「有女子向我說我們是由指令構成,真是這樣嗎?我和10億美元之間的唯一障礙就是一些隨機指令?你想說服我在我身後的完美創造是由1和0組成,僅為二元代碼,這完全沒道理,任何人說我們只是由1和0構成都是在妄想,如果我們只是如此,為何我們失去他人時會感到痛苦?」
假如AI發現自己是虛擬產物,他們的心聲又會是如何嗎?在網民完全透過AI生成的這些短片中,片中「人物」陷入同樣困境,不敢相信他們栩栩如生的「世界」竟然只是由一堆文字指令建成,但現實中的我們看到這些畫面細膩、對話流暢的短片時何嘗不是同樣難以相信?它們實際上來自Google最新影片生成模型Veo 3。
近年的AI影片畫面已非常逼真,但它們均有共同缺陷就是無法同時生成聲音 ,需另外製作音軌配搭,例如常見的AI主播,「歡迎來到我們的AI新聞,AI逐漸成為我們生活一部分,它每日變得越來越強大」,導致口型不吻合,聽上去好像後期配音,容易識穿。
但Google的最新模型只需一個指令就可同步生成畫面和音效,令人物自然讀出對白做到「音畫同步」,白宮在令人震驚的聲明中宣布,計劃以非常有主見的遊戲節目主持人取代所有美國大使。
真實感提升,如同在現場收音,特別的環境音效同樣可輕鬆呈現,荷里活級數的大場面安坐家中也可獨力打造,製作門檻大幅降低,影視產業勢必受到衝擊,但影片並非完全真假難分,只要細心去看,可找到這些「鬼影」瑕疵去辨別,在呈現體操動作時更會露出馬腳,但技術始終會不斷提升,日後恐怕要AI自行招認人類才可分清楚。「我們不是真的,你這樣說是甚麼意思?這是唯一解釋,我們不是真的,這一切都不是真的,我知道。」