李飛飛最新理論，AI 下個十年最需要的不是大語言模型

此篇文章以李飛飛教授的觀點為主軸，從人工智慧發展的歷史與現況出發，揭示AI在經歷語言革命之後，正邁向新的智慧前沿——「空間智慧」。文章指出，當ChatGPT掀起全球轟動時，世人以為人工智慧已達巔峰，然而，真正的智慧不僅是語言遊戲，而在於人類與生俱來、卻往往被忽略的能力：理解與操作空間的本能。李飛飛以多個例證說明，人類文明的關鍵進展—from古希臘人測地球週長到DNA雙螺旋的發現—皆源於空間感知與推理，而非語言。她進一步主張，人工智慧若要走向真正的「智慧」，就必須讓機器具備這種能夠感知現實、推理物理關係、並以直覺理解世界的空間能力。這不僅是技術挑戰，更是人類與AI共存的下一階段。

文章詳述所謂「空間智慧」（Spatial Intelligence）之核心在於讓AI能在物理與幾何規律中思考與行動。現有的大型語言模型雖能以文字掌握抽象知識，但缺乏對現實世界的理解，因此無法安全駕駛汽車、無法精準操作機器人，也無法像人類那樣在腦中「旋轉」物體或預測物理結果。李飛飛提出，要突破這個瓶頸，必須建構「世界模型」（World Model）——這是一種全新的生成式AI體系，能夠在語意、感知、物理與幾何間保持一致性。她將其定義為具備三大特徵：生成性、多模態性與互動性。這意味著AI必須能「創造」出符合物理規律的模擬世界、處理多種感官輸入（如影像、動作、文字等），並能根據動作或目標預測下一步的世界狀態。這樣的架構不僅能讓機器「看見」世界，還能「思考」與「行動」。然而，李飛飛也坦言，建構世界模型的難度遠超語言模型，因為「世界」的維度比文字更為龐雜，所需的訓練資料、演算法與模型架構都要重新設計。

文章後段轉入實際應用與人文願景層面，指出空間智慧的最終目標並非取代人類，而是「增強人類」。李飛飛強調，AI的發展應以尊重人類尊嚴與自主性為前提，讓科技成為創造力、同理與探索的助力。她認為空間智慧的實現將分三階段展開：首先是創造領域，賦能藝術家、遊戲產業與設計師進行沉浸式敘事；其次是機器人學，讓機器人能以具身智慧與人類協作；最終則是科學、醫療與教育，藉由模擬與感知推動新一輪革命。例如，AI可協助藥物研發、輔助診斷、構建沉浸式學習環境，甚至重塑人與世界的連結方式。為此，李飛飛與團隊成立World Labs，並推出具備世界建構能力的「Marble」平台，讓創作者得以以AI共同打造虛擬3D世界。文末，她以充滿信念的語調呼籲全球AI社群攜手努力，將空間智慧的發展導向人類福祉。

整體而言，此篇文章不僅為AI技術描繪了下一個重大轉折，更闡釋了一種融合科學理性與人文願景的未來觀。李飛飛將「空間智慧」視為人類智慧演化的延伸與再現：它不只是讓機器看見世界，而是讓AI學會像人一樣「身在世界之中」地理解與創造。隨著這項技術的成熟，AI將不再只會回答問題、產生文字，而會成為創意與探索的新夥伴，陪伴人類進入下一個兼具想像力與現實感的智慧時代。

閱讀完整文章:https://technews.tw/2025/11/13/fei-fei-li-ai-spatial-intelligence/