AI影片生成正進入新一輪競爭熱潮,而Google最新釋出的 Veo 3.1 模型,正是這場技術較勁中的重要一環。此篇文章聚焦於Google在AI影片生成領域的最新進展,深入說明Veo 3.1的核心升級、工具整合、實際應用,以及它在產業競局中的位置。
文章首先指出,Veo 3.1是在今年Google I/O大會所發表的Veo 3模型基礎上進一步優化而成。與前代相比,新版模型在「提示詞遵循度」與「圖像轉影片」的表現上有顯著提升。簡單來說,用戶現在可以上傳圖片作為素材,搭配文字提示,讓AI自動生成連貫的影片內容。這樣的設計不僅簡化了影片創作流程,也讓非專業影像工作者更容易參與創作。更令人注目的是,Veo 3.1首次加入了同步生成音訊的功能。這意味著,系統不僅能產出畫面,還能自動產生對應的聲音,使生成影片更加完整與沉浸。這項突破讓Veo從「畫面生成工具」正式邁向「多模態創作平台」,功能上明顯超越前代Veo 3。在應用層面上,此篇文章特別介紹了Veo 3.1已經整合進Google的Flow影片編輯器中。Flow編輯器新增的「畫面到影片」功能,讓使用者能上傳起始畫面與結束畫面,AI會自動生成中間的轉場與動態片段。這項功能大幅提升了影片製作的可控性,尤其適合需要快速製作分鏡、預覽或短片的創作者使用。
文章也提到,雖然 Adobe Firefly 同樣提供類似的生成影片功能,但Flow編輯器的優勢在於可同時生成音訊,並支援影片延伸與物件插入。這使得Google的解決方案在「整合性」與「創意靈活度」上更勝一籌。然而,此篇文章並未忽略目前AI影片生成仍存在的限制。根據Google分享的樣本影片,Veo 3.1生成的畫面仍帶有些許不真實感,畫質與細節的穩定度會隨提示詞和主題而異。儘管在真實感上可能尚未達到OpenAI的Sora 2等級,但Google的策略更著重在「實用性」與「專業影片工作流程整合」,希望讓Veo成為創作者的輔助工具,而非只用來製造社群短片的噱頭。最後,文章總結指出,Veo 3.1的推出象徵Google對AI創作工具市場的長期投入與野心。在AI影片生成技術持續升溫的當下,Google、OpenAI與Adobe等巨頭正以不同路線搶占創意生產的新入口。隨著Veo持續進化,未來AI或許將不再只是生成畫面的輔助,而是能全面參與構思、編輯與聲音設計的創作夥伴。