此篇文章以李飛飛教授的觀點為主軸,從人工智慧發展的歷史與現況出發,揭示AI在經歷語言革命之後,正邁向新的智慧前沿——「空間智慧」。文章指出,當ChatGPT掀起全球轟動時,世人以為人工智慧已達巔峰,然而,真正的智慧不僅是語言遊戲,而在於人類與生俱來、卻往往被忽略的能力:理解與操作空間的本能。李飛飛以多個例證說明,人類文明的關鍵進展—from古希臘人測地球週長到DNA雙螺旋的發現—皆源於空間感知與推理,而非語言。她進一步主張,人工智慧若要走向真正的「智慧」,就必須讓機器具備這種能夠感知現實、推理物理關係、並以直覺理解世界的空間能力。這不僅是技術挑戰,更是人類與AI共存的下一階段。
文章詳述所謂「空間智慧」(Spatial Intelligence)之核心在於讓AI能在物理與幾何規律中思考與行動。現有的大型語言模型雖能以文字掌握抽象知識,但缺乏對現實世界的理解,因此無法安全駕駛汽車、無法精準操作機器人,也無法像人類那樣在腦中「旋轉」物體或預測物理結果。李飛飛提出,要突破這個瓶頸,必須建構「世界模型」(World Model)——這是一種全新的生成式AI體系,能夠在語意、感知、物理與幾何間保持一致性。她將其定義為具備三大特徵:生成性、多模態性與互動性。這意味著AI必須能「創造」出符合物理規律的模擬世界、處理多種感官輸入(如影像、動作、文字等),並能根據動作或目標預測下一步的世界狀態。這樣的架構不僅能讓機器「看見」世界,還能「思考」與「行動」。然而,李飛飛也坦言,建構世界模型的難度遠超語言模型,因為「世界」的維度比文字更為龐雜,所需的訓練資料、演算法與模型架構都要重新設計。
文章後段轉入實際應用與人文願景層面,指出空間智慧的最終目標並非取代人類,而是「增強人類」。李飛飛強調,AI的發展應以尊重人類尊嚴與自主性為前提,讓科技成為創造力、同理與探索的助力。她認為空間智慧的實現將分三階段展開:首先是創造領域,賦能藝術家、遊戲產業與設計師進行沉浸式敘事;其次是機器人學,讓機器人能以具身智慧與人類協作;最終則是科學、醫療與教育,藉由模擬與感知推動新一輪革命。例如,AI可協助藥物研發、輔助診斷、構建沉浸式學習環境,甚至重塑人與世界的連結方式。為此,李飛飛與團隊成立World Labs,並推出具備世界建構能力的「Marble」平台,讓創作者得以以AI共同打造虛擬3D世界。文末,她以充滿信念的語調呼籲全球AI社群攜手努力,將空間智慧的發展導向人類福祉。
整體而言,此篇文章不僅為AI技術描繪了下一個重大轉折,更闡釋了一種融合科學理性與人文願景的未來觀。李飛飛將「空間智慧」視為人類智慧演化的延伸與再現:它不只是讓機器看見世界,而是讓AI學會像人一樣「身在世界之中」地理解與創造。隨著這項技術的成熟,AI將不再只會回答問題、產生文字,而會成為創意與探索的新夥伴,陪伴人類進入下一個兼具想像力與現實感的智慧時代。
閱讀完整文章:https://technews.tw/2025/11/13/fei-fei-li-ai-spatial-intelligence/