北京人形機器人創(chuàng)新中心提出WoW 讓AI真正理解物理世界!北京大學計算機學院、北京人形機器人創(chuàng)新中心以及香港科技大學聯(lián)合完成了一項突破性研究,于2025年10月發(fā)表在arXiv預印本平臺。研究團隊由北京大學的張尚航教授和唐建教授共同領導,匯集了來自三所頂尖學府的數(shù)十位研究人員。這項研究首次讓人工智能真正"理解"了物理世界的運作規(guī)律,而不僅僅是模仿表面現(xiàn)象。
當我們看到一個球從桌子上滾落時,我們本能地知道它會掉到地上,而不是懸浮在空中。這種對物理世界的直覺理解對人類來說是自然的,但對人工智能來說卻一直是個巨大的挑戰(zhàn)?,F(xiàn)有的AI視頻生成模型,比如OpenAI的Sora,雖然能制作出視覺效果驚艷的視頻,但它們就像只會畫畫的藝術家,能畫出好看的畫面,卻不懂得畫面背后的物理原理。它們可能會畫出物體懸浮在空中、違反重力定律的荒謬場景。
這種局限性的根源在于這些模型是通過觀看網(wǎng)絡視頻來學習的,就像一個從未親手觸摸過球的人,只能通過看別人玩球的視頻來"學習"球的特性。這種被動觀察的學習方式讓AI只能掌握事物的外觀,而無法理解事物運作的內(nèi)在規(guī)律。認知科學家讓·皮亞杰曾經(jīng)說過:"要了解一個物體,就必須對它采取行動。"這句話揭示了學習的本質:真正的理解來自于與世界的互動,而不是被動的觀察。
基于這個深刻的認知科學洞察,北京大學的研究團隊開發(fā)了WoW(World-Omniscient World Model)世界模型,這是一個擁有140億參數(shù)的生成式世界模型。與傳統(tǒng)模型最大的不同在于,WoW是通過200萬個真實機器人互動軌跡進行訓練的。這些數(shù)據(jù)涵蓋了5275個不同任務和12種不同類型的機器人,就像讓AI親手體驗了無數(shù)次物理互動,從而真正學會了重力、碰撞、慣性等物理定律。
2025世界人形機器人運動會,在機器人異彩紛呈的表現(xiàn)背后,是相關技術的不斷迭代更新。
2025-08-18 07:50:28世界人形機器人運動會為創(chuàng)新找準突破口