麻省理工學院與豐田研究院攜手打造可引導生成式AI平台,推動機器人虛擬訓練環境進化

在生成式AI快速滲透各領域的浪潮下,麻省理工學院(MIT)電腦科學與人工智慧實驗室(CSAIL)與豐田研究院(Toyota Research Institute)近期發表一項突破性研究:「可引導場景生成」(Steerable Scene Generation)。此篇文章深入介紹這項技術如何改變AI在虛擬環境中的學習方式,並揭示其對機器人、自駕車與數位孿生城市發展的潛在影響。不同於一般AI僅能生成靜態圖像或3D模型,這項新技術讓AI能主動構建、調整與重建整個虛擬場景。換言之,AI不再只是畫面創作者,而是能「思考」如何打造能滿足特定任務需求的環境——例如設計一間廚房,觀察機器人如何搬運物品;或模擬餐廳空間,測試機器人如何應對人群移動與障礙物。

此篇文章指出,該系統的核心在於結合超過4400萬個3D房間資料與「蒙地卡羅樹搜尋(Monte Carlo Tree Search, MCTS)」策略。這讓AI能在場景生成過程中進行策略性判斷,逐步微調空間結構與物件擺放,以產生更真實、目的性更強的模擬場景。MIT博士生暨研究員Nicholas Pfaff表示,這是首次將MCTS應用於生成式設計,讓AI能像人類一樣思考、嘗試與修正。「我們把場景生成當作一連串決策任務,AI會根據結果不斷調整,直到創造出最理想的模擬環境。」他強調,這種方式生成的空間在複雜度與細節上,遠勝於傳統擴散模型(Diffusion Model)。在機器人領域中,這項技術的意義尤為重大。文章引述亞馬遜機器人應用科學家Jeremy Binagia的觀點指出,過去機器人學習受限於真實數據與環境不足,「可引導場景生成」能有效彌補這個缺口,讓虛擬訓練更加貼近現實,並創造多樣化與挑戰性的模擬情境,有助於讓機器人學會更廣泛的任務能力。

研究團隊也透露,目前系統仍屬概念驗證階段,但MIT與豐田正積極擴大資料規模與物件多樣性,未來目標是讓AI能自主創造全新資產與環境,而不再仰賴既有素材庫。這意味著AI未來可能成為「虛擬世界的建築師」,能根據任務自動生成可訓練、可互動、可驗證的完整環境。此篇文章最後指出,若這項技術持續發展,其應用將不僅侷限於機器人訓練,還有望延伸至自駕車模擬、AR/VR交互場景設計、甚至數位孿生城市建構。當生成式AI從「畫面創造」進化為「決策創造」,MIT與豐田的合作正揭示一個新方向——未來AI不僅能模擬世界,更能設計出讓自己學會理解世界的環境。

閱讀完整文章:https://mashdigi.com/mit-and-toyota-research-institute-collaborate-on-a-guideable-generative-ai-platform-to-advance-virtual-robotics-training-environments/

Related posts