這篇文章主要介紹了 Google 最新推出的影像生成模型Nano Banana 2(Gemini 3.1 Flash Image),並對其功能特色、技術進步以及應用場景做了深入解析。文章指出,Nano Banana 系列自去年 8 月首次亮相以來,便以快速生成與編輯影像的能力受到關注;隨後在 11 月推出的 Nano Banana Pro,則針對更高階的創作控制與智慧處理能力進行優化。而此次推出的 Nano Banana 2,則結合了前兩代的優勢:保留 Flash 系列強調的即時反應速度,同時整合 Pro 系列的高階功能,以求在生成速度、視覺品質與指令理解能力之間取得最佳平衡。
文章特別指出,Nano Banana 2 的核心亮點之一是結合 Gemini 的世界知識資料,並透過即時網路搜尋與圖像資訊輔助生成結果。官方表示,這使模型在呈現特定主題或產生資訊圖表時更為精準,並可將文字筆記轉換為圖解或資料視覺化內容,對教育、行銷與設計場景都有實質幫助。此外,此篇文章也提到,Nano Banana 2 強化了影像中的文字生成與翻譯功能,能夠在圖片中呈現清晰可辨的文字,並支援多語言本地化處理,尤其在行銷素材與視覺設計中非常實用。實際測試顯示,繁體中文的輸出亦能順利生成,雖然細節上仍可能出現少量錯誤,但整體效果與先前的 Nano Banana Pro 相當。
在影像品質方面,Nano Banana 2 對角色與物件的一致性進行了顯著改善。官方資料顯示,單一生成流程中最多可保持五名角色的外觀一致,並穩定呈現最多 14 個物件的細節,這對分鏡創作、敘事設計及影像故事化呈現具有明顯助益。同時,新模型也提升了對複雜指令的理解能力,使生成內容更符合使用者的創作意圖。此外,Nano Banana 2 支援從 512 像素至 4K 的多種解析度及長寬比設定,可因應不同平台與媒介需求,提供更靈活的影像輸出方案。文章還提到,Google 對 Nano Banana 2 在光影表現、材質細節以及整體清晰度上的改進也給予了特別強調。透過優化演算法,模型在維持高速生成的同時,畫面品質明顯提升,無論是角色表情、場景光影還是物件質感都更為精細,為專業影像創作者與設計師提供了更高效且高質的創作工具。
總體而言,此篇文章完整描繪了 Nano Banana 2 的技術演進與實際應用價值:它不僅延續了 Flash 系列快速生成的特性,更吸納了 Pro 系列的高階智慧控制能力,並在文字處理、多語言支援、角色與物件一致性及畫面品質上有所突破。對於設計師、行銷人員、教育工作者以及任何需要高效率影像生成的人士來說,Nano Banana 2 都提供了一個兼具速度與品質的解決方案。
閱讀完整文章:https://www.techbang.com/posts/128113-nano-banana-2-flash-pro-performance