“為什么大量使用遙控器操作,這與我們擁有的數(shù)據(jù)量有關(guān)?!蓖踔龠h(yuǎn)認(rèn)為,機(jī)器人時(shí)代可能仍會(huì)遵循此前深度學(xué)習(xí)1.0時(shí)代視覺識(shí)別的發(fā)展路徑,即先用小的、專用的具身模型進(jìn)行產(chǎn)品化落地,使機(jī)器人產(chǎn)業(yè)先跑起來(lái),在活下來(lái)的同時(shí)把某個(gè)場(chǎng)景某個(gè)任務(wù)做到99%以上的準(zhǔn)確度,達(dá)到一個(gè)能夠長(zhǎng)時(shí)間運(yùn)行、不至于發(fā)熱損壞的穩(wěn)定狀態(tài),在這個(gè)過(guò)程中不斷產(chǎn)生數(shù)據(jù),提升泛化通用能力,從而形成閉環(huán)。
“如果有一天,機(jī)器人‘公民’數(shù)量越來(lái)越多,他們產(chǎn)生了海量的機(jī)器人專有數(shù)據(jù),而且這些數(shù)據(jù)能夠公開,能夠被廣泛訓(xùn)練和使用,屆時(shí)才有可能產(chǎn)生真正意義上的具身智能大模型。在最終理想狀態(tài)下,具身智能機(jī)器人能夠?qū)υ捊涣?,看到真?shí)的世界,自主做決策和執(zhí)行,但是這顯然還有很長(zhǎng)的路要走。”王仲遠(yuǎn)說(shuō)道。
值得一提的是,在記者采訪的機(jī)器人企業(yè)中,部分企業(yè)持樂(lè)觀的預(yù)期看法,認(rèn)為明年行業(yè)或?qū)⒓w“拋棄”遙控器。其中,旗下?lián)碛蟹律鷻C(jī)器人、IP機(jī)器人等產(chǎn)品線的企業(yè)公共關(guān)系與政府事務(wù)部總經(jīng)理吳為表示,今年下半年以來(lái),商業(yè)化訂單開始規(guī)模交付,該公司的主要客戶集中于銀行、教育等行業(yè)?!皬男枨蠖藖?lái)看,商業(yè)化運(yùn)用的機(jī)器人一定沒有遙控器,客戶不可能買臺(tái)機(jī)器人,還配一個(gè)人來(lái)遙控它,所以這會(huì)倒逼機(jī)器人企業(yè)脫離對(duì)遙控器的依賴。”
除了商業(yè)場(chǎng)景中的應(yīng)用,事實(shí)上,在國(guó)內(nèi)外市場(chǎng),多家瞄準(zhǔn)通用形人形機(jī)器人的企業(yè)已在產(chǎn)品中打出了“全自主”“非遙控”的旗號(hào),不過(guò)自主化的程度、穩(wěn)定性尚有待市場(chǎng)的檢驗(yàn)。在關(guān)于具身智能的通用泛化能力如何提升探索中,當(dāng)前行業(yè)主要有三條技術(shù)路線,分別是端到端VLA(視覺-語(yǔ)言-動(dòng)作)模型、“大腦+小腦”分層模型、世界模型,當(dāng)然三條路線并不是非此即彼,甚至不少科技企業(yè)、學(xué)術(shù)研究機(jī)構(gòu)均有所布局。業(yè)界普遍認(rèn)為,具身智能領(lǐng)域尚未出現(xiàn)像大語(yǔ)言模型的ChatGPT時(shí)刻,相關(guān)的技術(shù)探索還未收斂,這就意味著具身智能真正的自主化、智能化尚有待成熟,機(jī)器人真正告別“背后有人”顯然還有一段路要走。