最近,全球網(wǎng)民通過直播見證了Figure AI的人形機(jī)器人在物流傳送帶上連續(xù)工作幾十個(gè)小時(shí),不間斷地分揀包裹。這一過程完全依靠機(jī)器人的視覺系統(tǒng)自主完成識(shí)別、抓取和分揀動(dòng)作,標(biāo)志著具身智能的一個(gè)重要里程碑。
當(dāng)前具身智能的核心是智能體(Agent)。如今,機(jī)器人已邁向基于模型的端到端推理階段,不再只是按照預(yù)設(shè)程序完成單一動(dòng)作,而是要依靠自身視覺系統(tǒng)識(shí)別環(huán)境、理解目標(biāo)、規(guī)劃動(dòng)作,并在持續(xù)變化的物理世界中完成任務(wù)。誰能更好地讓機(jī)器人看懂世界、推理任務(wù)、想象后果并執(zhí)行動(dòng)作,誰就更接近通用具身智能的核心。
國內(nèi)具身智能領(lǐng)域傳來一個(gè)重要進(jìn)展,北京人形機(jī)器人創(chuàng)新中心在全球權(quán)威評測WorldArena中取得突破。其發(fā)布的Pelican-Unify 1.0具身大一統(tǒng)模型登頂榜單,EWM Score穩(wěn)居榜首,3D Accuracy接近滿分。此前,北京人形發(fā)布的WoW具身世界模型也曾在WorldArena Data Engine賽道上獲得Hugging Face官方推薦,并被斯坦福等頂尖團(tuán)隊(duì)引用。這意味著北京人形成為全球唯一同時(shí)登頂WorldArena兩大核心賽道的機(jī)構(gòu),躋身具身大腦能力世界第一梯隊(duì)。
從榜單成績來看,Pelican-Unify 1.0以66.03的得分位居榜首,在多維度評估中表現(xiàn)出色。特別是在3D Accuracy上達(dá)到了98.12,接近滿分,顯示出該模型具備接近真實(shí)世界的空間建模能力。這不僅意味著模型生成的畫面質(zhì)量高,更重要的是它能準(zhǔn)確理解和重建場景中的空間關(guān)系,對機(jī)器人至關(guān)重要。
自2025年以來,智能體成為AI行業(yè)的熱門詞匯。OpenAI、谷歌等公司紛紛押注,國內(nèi)大模型廠商也積極參與。智能體的核心邏輯是讓模型不僅能回答問題,還能完成任務(wù),感知環(huán)境、制定計(jì)劃、調(diào)用工具、持續(xù)執(zhí)行。這一邏輯在數(shù)字世界尚可實(shí)現(xiàn),但在物理世界中面臨更多挑戰(zhàn)。
傳統(tǒng)具身智能系統(tǒng)的邏輯更像是“堆積木”,各模塊之間存在語義鴻溝,阻礙了機(jī)器人真正理解任務(wù)。北京人形提出了一條不同路徑:讓理解、推理、想象與行動(dòng)在同一個(gè)模型內(nèi)部協(xié)同演化。經(jīng)過一年多的迭代與實(shí)踐,這一思路在2026年5月得到驗(yàn)證,發(fā)布了首個(gè)“大一統(tǒng)”具身基礎(chǔ)模型Pelican-Unify 1.0。
Pelican-Unify 1.0實(shí)現(xiàn)了三大統(tǒng)一:理解、推理和生成。架構(gòu)上由一個(gè)視覺-語言模型和一個(gè)統(tǒng)一未來生成器構(gòu)成。通過共享表征,使語言推理、視頻想象和動(dòng)作預(yù)測在共同的表征中相互約束、協(xié)同演化。實(shí)驗(yàn)結(jié)果表明,該模型在多個(gè)國際榜單上表現(xiàn)優(yōu)異,展示了強(qiáng)大的專項(xiàng)能力。
北京人形的慧思開物平臺(tái)定位為全球首個(gè)“一腦多能、一腦多機(jī)”的通用具身智能平臺(tái)。Pelican-Unify 1.0作為平臺(tái)的首發(fā)版本,提供了真正的認(rèn)知內(nèi)核,實(shí)現(xiàn)了在同一理解-推理-想象-行動(dòng)回路下的自然泛化。這一能力在實(shí)際硬件上得到了驗(yàn)證,模型在工業(yè)機(jī)械臂和人形機(jī)器人上的操作任務(wù)中全面超越了模塊化基線方法。
經(jīng)過一年多的場景打磨,慧思開物已從技術(shù)演示走向可量產(chǎn)的工業(yè)落地。搭載慧思開物的“具身天工2.0”進(jìn)入福田康明斯發(fā)動(dòng)機(jī)工廠,完成了料箱取放與搬運(yùn)任務(wù)。此外,慧思開物SDK開放,面向高校與產(chǎn)業(yè)伙伴構(gòu)建開源生態(tài),并在世界人工智能大會(huì)上展示了分布式具身智能體系統(tǒng)的協(xié)同能力。
北京人形的身份在國內(nèi)具身智能版圖中具有獨(dú)特性,由多家企業(yè)和資本共同發(fā)起,確立了國家級創(chuàng)新平臺(tái)定位。軟硬件層面,北京人形發(fā)布了新一代通用機(jī)器人平臺(tái)具身天工3.0,實(shí)現(xiàn)了觸物交互式全身高動(dòng)態(tài)運(yùn)動(dòng)控制。Pelican-Unify 1.0的成功不僅是技術(shù)突破,更是系統(tǒng)性能力積累的體現(xiàn)。
2026年,具身智能行業(yè)正處于技術(shù)分層時(shí)刻。頭部企業(yè)已跨過千臺(tái)乃至萬臺(tái)交付門檻,行業(yè)核心問題轉(zhuǎn)變?yōu)槿绾卧谛聢鼍爸姓嬲糜?。Pelican-Unify 1.0給出了一個(gè)早期但有說服力的答案,推動(dòng)了從功能拼湊到閉環(huán)智能的轉(zhuǎn)變。
今天(3月17日),北京市市場監(jiān)管局(以下簡稱“市監(jiān)局”)在深化“北京服務(wù)”賦能企業(yè)高質(zhì)量發(fā)展新聞發(fā)布會(huì)上表示
2026-03-18 08:02:53北京將推出人形機(jī)器人經(jīng)營范圍主題套餐