讓機器人更像人 世界模型成AI領域下個十年風口?
「世界模型」,指的是讓AI像人類一樣,在腦海中構建一個對現實世界的「內部模擬器」,也是讓機器人變得更像人的關鍵。圖爲一名小觀衆近距離觸摸人形機器人。(新華社資料照片)
大陸企查查數據顯示,今年以來,大陸發生25起世界模型相關的融資事件,融資總額超人民幣22億元(約新臺幣96億)。業內認爲,意味行業正在形成共識:AI從數字世界走向物理世界是下個主戰場。當前資本押注企業要跑通「數據—模型—場景」飛輪,如果企業能率先在真實場景中完成規模化部署,就能形成先發優勢。
「世界模型」,指的是讓AI像人類一樣,在腦海中構建一個對現實世界的「內部模擬器」。它使AI能夠理解物理規律、預測未來發生什麼,並在不實際採取行動的情況下,通過「想像」來規劃行動。今年圖靈獎得主楊立昆創辦世界模型公司,「AI教母」李飛飛的世界模型公司獲鉅額融資,突顯業內認爲世界模型或是AI下個10年的重要風口。
證券時報引述企查查數據顯示,大陸企業極佳視界3月宣告完成10億元的Pre-B輪融資,並在同月宣佈其具身世界模型GigaWorld-1登上WorldArena榜首。
酷哇科技創始人兼CEO何弢稱,2026年以來針對世界模型的密集高額融資,表明資本和技術界一致認定「大語言模型的下一站是物理世界」,世界模型是通往物理AI的必經之路,屬於具身智能的「ChatGPT時刻」即將來臨。在未來的世界模型行業競爭中,掌控規模化物理數據入口並實現商業閉環的企業,才能主導這一輪技術革命。
同樣將焦點鎖定在世界模型的大曉機器人近期開源「開悟世界模型3.0(Kairos 3.0)」-4B系列具身原生世界模型。其爲全球首個可端側驅動具身智能本體控制的世界模型,也是業內首個在THOR端側平臺達成 1:1.5(視頻生成時間:視頻時長)實時生成的具身世界模型。讓機器人真正從「會表演」走向「能幹活」。換言之,能實現「多模態理解—生成—預測」一體化。
聚焦工業場景、研發「藍領機器人」的上海開普勒機器人亦開始構建工業世界模型和家庭世界模型。開普勒首席技術官席奧表示,公司計劃先將工業世界模型與工業VLA融合,並通過小規模POC(可行性驗證)驗證其效果,爲未來大規模落地打下基礎。
對於世界模型面臨的挑戰,許多機器人企業負責人不約而同提到數據議題。大曉機器人董事長王曉剛對本報表示,一個強大的大腦基礎一個重要的要素便是數據採集方式,包括用什麼樣的數據去訓練大腦,所以之前曾提到有真機的數據換成以人爲中心的數據,讓數據變得更真實,體量會更大。
何弢說,操作數據不能完全依賴互聯網視頻數據或計算機仿真數據。「換句話說,溫室裡長不出真正的世界模型,純靠雲端仿真數據無法解決物理世界無盡的長尾問題。」