Google推出Veo 3.1影像生成模型，強化圖像轉影片能力

AI影片生成正進入新一輪競爭熱潮，而Google最新釋出的 Veo 3.1 模型，正是這場技術較勁中的重要一環。此篇文章聚焦於Google在AI影片生成領域的最新進展，深入說明Veo 3.1的核心升級、工具整合、實際應用，以及它在產業競局中的位置。

文章首先指出，Veo 3.1是在今年Google I/O大會所發表的Veo 3模型基礎上進一步優化而成。與前代相比，新版模型在「提示詞遵循度」與「圖像轉影片」的表現上有顯著提升。簡單來說，用戶現在可以上傳圖片作為素材，搭配文字提示，讓AI自動生成連貫的影片內容。這樣的設計不僅簡化了影片創作流程，也讓非專業影像工作者更容易參與創作。更令人注目的是，Veo 3.1首次加入了同步生成音訊的功能。這意味著，系統不僅能產出畫面，還能自動產生對應的聲音，使生成影片更加完整與沉浸。這項突破讓Veo從「畫面生成工具」正式邁向「多模態創作平台」，功能上明顯超越前代Veo 3。在應用層面上，此篇文章特別介紹了Veo 3.1已經整合進Google的Flow影片編輯器中。Flow編輯器新增的「畫面到影片」功能，讓使用者能上傳起始畫面與結束畫面，AI會自動生成中間的轉場與動態片段。這項功能大幅提升了影片製作的可控性，尤其適合需要快速製作分鏡、預覽或短片的創作者使用。

文章也提到，雖然 Adobe Firefly 同樣提供類似的生成影片功能，但Flow編輯器的優勢在於可同時生成音訊，並支援影片延伸與物件插入。這使得Google的解決方案在「整合性」與「創意靈活度」上更勝一籌。然而，此篇文章並未忽略目前AI影片生成仍存在的限制。根據Google分享的樣本影片，Veo 3.1生成的畫面仍帶有些許不真實感，畫質與細節的穩定度會隨提示詞和主題而異。儘管在真實感上可能尚未達到OpenAI的Sora 2等級，但Google的策略更著重在「實用性」與「專業影片工作流程整合」，希望讓Veo成為創作者的輔助工具，而非只用來製造社群短片的噱頭。最後，文章總結指出，Veo 3.1的推出象徵Google對AI創作工具市場的長期投入與野心。在AI影片生成技術持續升溫的當下，Google、OpenAI與Adobe等巨頭正以不同路線搶占創意生產的新入口。隨著Veo持續進化，未來AI或許將不再只是生成畫面的輔助，而是能全面參與構思、編輯與聲音設計的創作夥伴。

閱讀完整文章：https://mashdigi.com/google-launches-veo-3-1-image-generation-model-to-enhance-image-to-video-conversion-capabilities/