未來屬于混合仿真時代,既繼承經(jīng)典仿真引擎的優(yōu)勢,又融合現(xiàn)代神經(jīng)網(wǎng)絡(luò)的能力,實(shí)現(xiàn)兩者的協(xié)同進(jìn)化。一直以來,sim2real是實(shí)現(xiàn)空間與具身智能的主要路徑之一,而real2sim2real直接打破了繁瑣的動作微調(diào)難題,彌合了sim2real的差距,讓機(jī)器人能夠模仿各種類人的動作。Jim Fan對此暢想道,2030年的人形機(jī)器人奧運(yùn)會一定會是一場盛宴。有網(wǎng)友期待地表示,真想看看它們打拳擊的表現(xiàn)。
由于仿真環(huán)境和現(xiàn)實(shí)世界的動力學(xué)差異,人形機(jī)器人實(shí)現(xiàn)敏捷協(xié)調(diào)的全身運(yùn)動仍是巨大挑戰(zhàn)?,F(xiàn)有方法如系統(tǒng)識別(SysID)和域隨機(jī)化(DR)通常需要大量時間調(diào)整參數(shù),或者生成的策略過于保守。ASAP是一個兩階段框架,旨在解決動力學(xué)不匹配問題,實(shí)現(xiàn)敏捷的人形機(jī)器人全身動作。ASAP實(shí)現(xiàn)了許多以前難以做到的高難度動作,展現(xiàn)了delta動作學(xué)習(xí)在縮小仿真與現(xiàn)實(shí)動力學(xué)差距方面的潛力。
具體步驟如下:先從真人視頻中提取動作并重定向到機(jī)器人上,預(yù)訓(xùn)練多個運(yùn)動跟蹤策略,生成真實(shí)世界的運(yùn)動軌跡。基于真實(shí)世界軌跡數(shù)據(jù),訓(xùn)練Delta動作模型,縮小仿真狀態(tài)與真實(shí)世界狀態(tài)之間的差異。Delta動作模型訓(xùn)練完成后,將其集成到仿真器中,使仿真器能匹配真實(shí)世界的物理特性,隨后對之前預(yù)訓(xùn)練的運(yùn)動跟蹤策略進(jìn)行微調(diào)。最后,直接在真實(shí)環(huán)境中部署微調(diào)后的策略,此時不再需要Delta動作模型。
ASAP包括兩個階段:預(yù)訓(xùn)練階段和后訓(xùn)練階段。在預(yù)訓(xùn)練階段,研究團(tuán)隊(duì)將真人運(yùn)動視頻作為數(shù)據(jù)來源,在仿真環(huán)境中訓(xùn)練動作跟蹤策略。將這些運(yùn)動數(shù)據(jù)重定向到人形機(jī)器人上,訓(xùn)練一個基于相位條件的運(yùn)動跟蹤策略,讓機(jī)器人模仿重定向后的動作。然而,如果將這一策略部署到真實(shí)硬件上,由于動力學(xué)差異,機(jī)器人的性能會下降。為解決這一問題,在后訓(xùn)練階段需要收集真實(shí)世界的運(yùn)行數(shù)據(jù),包括本體感知狀態(tài)和動作捕捉系統(tǒng)記錄的位置信息。隨后,在仿真環(huán)境中回放這些數(shù)據(jù),動力學(xué)差異以跟蹤誤差的形式表現(xiàn)出來。接著,訓(xùn)練一個delta動作模型,通過縮小真實(shí)世界和仿真狀態(tài)的差異,學(xué)習(xí)如何補(bǔ)償這些偏差。最后,借助delta動作模型對預(yù)訓(xùn)練的策略進(jìn)行微調(diào),使其更好地適應(yīng)真實(shí)世界的物理環(huán)境,從而實(shí)現(xiàn)更穩(wěn)定、敏捷的運(yùn)動控制。
在本屆CES上,英偉達(dá)發(fā)布了一系列面向AI時代的新產(chǎn)品和技術(shù),其中NVIDIA Cosmos平臺的推出尤為引人注目
2025-01-14 11:19:40英偉達(dá)的機(jī)器人軍團(tuán)近半來自中國原小鵬機(jī)器人運(yùn)控負(fù)責(zé)人達(dá)興燁在年后離職,加入了英偉達(dá)。目前,小鵬這一崗位由其他人員暫代,正在尋找合適人選
2025-02-26 15:57:02原小鵬機(jī)器人運(yùn)控負(fù)責(zé)人加入英偉達(dá)