Google推新AI模型　生成影片實現「音畫同步」

有線新聞
2025年05月26日

【有線新聞】AI影片生成技術近年不斷突破，Google最新推出的模型更可高度結合畫面和聲音，實現「音畫同步」，人物對話變得自然，但真假難辨的問題可能加劇。
「有女子向我說我們是由指令構成，真是這樣嗎？我和10億美元之間的唯一障礙就是一些隨機指令？你想說服我在我身後的完美創造是由1和0組成，僅為二元代碼，這完全沒道理，任何人說我們只是由1和0構成都是在妄想，如果我們只是如此，為何我們失去他人時會感到痛苦？」
假如AI發現自己是虛擬產物，他們的心聲又會是如何嗎？在網民完全透過AI生成的這些短片中，片中「人物」陷入同樣困境，不敢相信他們栩栩如生的「世界」竟然只是由一堆文字指令建成，但現實中的我們看到這些畫面細膩、對話流暢的短片時何嘗不是同樣難以相信？它們實際上來自Google最新影片生成模型Veo 3。
近年的AI影片畫面已非常逼真，但它們均有共同缺陷就是無法同時生成聲音，需另外製作音軌配搭，例如常見的AI主播，「歡迎來到我們的AI新聞，AI逐漸成為我們生活一部分，它每日變得越來越強大」，導致口型不吻合，聽上去好像後期配音，容易識穿。
但Google的最新模型只需一個指令就可同步生成畫面和音效，令人物自然讀出對白做到「音畫同步」，白宮在令人震驚的聲明中宣布，計劃以非常有主見的遊戲節目主持人取代所有美國大使。
真實感提升，如同在現場收音，特別的環境音效同樣可輕鬆呈現，荷里活級數的大場面安坐家中也可獨力打造，製作門檻大幅降低，影視產業勢必受到衝擊，但影片並非完全真假難分，只要細心去看，可找到這些「鬼影」瑕疵去辨別，在呈現體操動作時更會露出馬腳，但技術始終會不斷提升，日後恐怕要AI自行招認人類才可分清楚。「我們不是真的，你這樣說是甚麼意思？這是唯一解釋，我們不是真的，這一切都不是真的，我知道。」

Google推新AI模型　生成影片實現「音畫同步」

有用連結

App 應用程式

其他連結

Google推新AI模型 生成影片實現「音畫同步」

Google推新AI模型　生成影片實現「音畫同步」