精細(xì)操作瓶頸集中在靈巧手領(lǐng)域。人超過(guò)70%的物理交互和90%的精細(xì)操作依賴雙手完成,但機(jī)器人因觸覺(jué)傳感技術(shù)瓶頸,無(wú)法實(shí)現(xiàn)靈巧抓取。現(xiàn)有靈巧手成本占機(jī)器人總成本的20%以上,且存在“力量與速度難以兼顧”“高柔順與高精度無(wú)法同時(shí)實(shí)現(xiàn)”等難題。抓魚、系鞋帶、彈鋼琴等對(duì)人類簡(jiǎn)單的動(dòng)作,對(duì)機(jī)器人仍屬登天難度。
自主思考瓶頸在于大模型的泛化能力。模型本質(zhì)仍是“考試型選手”,一旦進(jìn)入真實(shí)物理世界,視覺(jué)語(yǔ)義與關(guān)節(jié)動(dòng)作之間存在斷層,“知道該做什么卻做不到”。前沿VLA模型真實(shí)任務(wù)成功率有限,工業(yè)級(jí)可靠性遠(yuǎn)未達(dá)標(biāo),這是全球具身智能共同面臨的早期瓶頸。
因此,行業(yè)研發(fā)資源也正從“小腦層”向“大腦層”傾斜。宇樹科技IPO募資42億元中,近50%投向具身大模型研發(fā);優(yōu)必選2026年研發(fā)預(yù)算將從5億增至7億元,重點(diǎn)投向具身大模型與世界模型。京東、美團(tuán)、字節(jié)等大廠均在具身智能大模型上投入巨大。其中,京東將建立全球最大數(shù)據(jù)采集場(chǎng),兩年內(nèi)采集1000萬(wàn)小時(shí)真實(shí)場(chǎng)景數(shù)據(jù),覆蓋商業(yè)服務(wù)、工業(yè)制造等領(lǐng)域。
工信部已于2025年底成立人形機(jī)器人與具身智能標(biāo)委會(huì),加速安全、接口等規(guī)范統(tǒng)一,為消費(fèi)級(jí)規(guī)?;伮?,相關(guān)扶持政策也在快速推進(jìn)。機(jī)器人馬拉松的終點(diǎn)就在那里,但機(jī)器人產(chǎn)業(yè)的方向遠(yuǎn)不止于奔跑。當(dāng)賽道上的鋼鐵選手們能穩(wěn)定跑完21公里,下一步將是學(xué)會(huì)像人類一樣系鞋帶、擰螺絲、端茶倒水。那才是具身智能真正的“完賽時(shí)刻”。