在今年的 Made by Google 發表會上,Google花了相當篇幅,說明自家手機如何透過裝置端AI功能,提供低延遲、高隱私的使用體驗。此篇文章指出,Pixel 10搭載的AI功能,包括 Pro Res Zoom(透過AI實現百倍長焦)、Voice Translate(即時語音翻譯,使用者可用自己的聲音溝通)、以及 Magic Cue(根據使用情境提供建議),都不需要持續連網便可運行,彰顯了Google在裝置端AI的技術實力。
這些功能能夠實現,核心在於 Tensor G5晶片。文章引述席德的說法:「它是第一款真正將使命錨定在機器學習上的行動SoC,在今天的Gemini時代更顯重要。」Tensor G5不只是Pixel 10的運算引擎,也是Google過去五年專注於裝置端AI晶片策略的成果。
本文特別提到,Tensor G5的提升非常驚人。例如,三年前Pixel的頂級相機變焦模型僅約 1萬個參數,如今在Tensor G5加持下,模型參數已達 10億;語音互動模型亦從過去幾乎不可能在手機運行的規模,擴張至超過 30億參數。這背後展現的,是Google標榜的 全端方法(full-stack approach):晶片、模型到應用端全面整合,雲端與手機端互補,使AI模型運行不再是妥協,而是選擇最佳策略。
席德進一步說明,Pixel團隊自Tensor G5開發起,就與 DeepMind深度合作。DeepMind負責提供模型改進建議,Tensor團隊則根據手機在記憶體、運算和功耗上的限制,調整晶片設計。此篇文章舉例了兩項創新成果:
- Matformer架構:讓Pixel動態選擇運行大模型或小模型,平衡速度與品質。
- 逐層嵌入(per-layer embeddings):在不犧牲品質前提下,讓模型符合手機記憶體限制。
硬體部分,Tensor G5為歷史上最大升級。CPU效能提升 34%,AI核心TPU運算能力提升 60%,而轉向 台積電3奈米製程,也是今年重要決策之一,確保晶片性能與能耗管理達到最佳平衡。
在軟硬整合後,Pixel 10將AI能力轉化為可感知的使用者體驗。文章指出,Pixel 10將上下文長度提升至 3萬2千個符元,支援未來生成式AI需求;同時,原生運行 C2PA,可建立內容憑證,記錄每一次照片編輯,甚至包含AI修圖或合成過程,確保影像來源透明與可信。
展望未來,Google仍面臨挑戰:如部分AI功能可能擴散到其他Android品牌,降低Tensor G5獨特性;若DeepMind規劃的通用助理成真,手機需要無間斷監測使用者環境,對能耗與符元管理將是重大考驗。文章最後以席德的話收尾:「這是我們五週年,但在許多方面,這才只是個開始。」Tensor G5並非終點,而是Google將AI下放至手機的重要起點。