在江蘇宿遷,一幅科技圖景正逐漸成為日常。人們頭戴輕量化采集設(shè)備,進行擦桌子、疊衣服、摘獼猴桃等日?;顒?,仿佛在無聲地“教學(xué)”。他們的“學(xué)生”是遠在數(shù)據(jù)中心的機器人。

這不是科幻電影中的場景,而是宿遷具身智能數(shù)據(jù)采集社區(qū)的真實一幕。5月20日,京東宣布全國首個具身智能數(shù)據(jù)采集社區(qū)在宿遷正式運行。居民們通過佩戴輕量化采集設(shè)備,在日常勞動中記錄下的每一個細微動作,都將轉(zhuǎn)化為數(shù)據(jù),注入具身智能模型,使未來的機器人更加聰明和能干。

這是京東自今年3月宣布將建設(shè)全球規(guī)模最大的具身數(shù)據(jù)采集中心以來的重要一步。按照規(guī)劃,京東將在兩年內(nèi)動員內(nèi)部超10萬名員工和外部最多50萬各行業(yè)人員,完成超過1000萬小時真實場景視頻數(shù)據(jù)的采集,目標(biāo)是成為全球最大的具身智能數(shù)據(jù)公司。宿遷是這場大規(guī)模行動的第一塊試驗田。

在宿遷湖濱新區(qū),數(shù)據(jù)采集的場景非常接地氣。社區(qū)居民陳麗(化名)一天的“數(shù)采工作”從戴上京東自研的JoyEgoCam采集終端開始。這款設(shè)備整機僅重220克,內(nèi)置推理單元與車規(guī)級慣性測量單元,能夠精準(zhǔn)捕捉上肢軌跡、力度分布、手眼協(xié)調(diào)等關(guān)鍵參數(shù),幾乎不干擾她的正常生活。她照常擦桌、掃地、疊衣,而機器人的數(shù)據(jù)便在此過程中悄然生成。這種靈活的工作模式吸引了許多寶媽群體積極參與。
走出家門,數(shù)據(jù)采集的場景更為豐富。在宿遷迷侯小鎮(zhèn)的獼猴桃園,果農(nóng)一邊進行“綁枝”作業(yè),一邊完成數(shù)據(jù)采集,記錄下農(nóng)業(yè)作業(yè)中的手眼協(xié)調(diào)軌跡、農(nóng)具握持的力學(xué)數(shù)據(jù)以及田間避障動作。在服裝工廠,縫紉女工的操作數(shù)據(jù)被同步采集,為工業(yè)柔性操作模型提供高精度訓(xùn)練素材。在養(yǎng)老院,護理員協(xié)助老人起身、喂藥、康復(fù)訓(xùn)練等行為也被逐一記錄,成為服務(wù)機器人理解人類照護需求的真實樣本。
這些來自家庭、農(nóng)田、工廠、商鋪的真實數(shù)據(jù),經(jīng)過上傳、質(zhì)檢、標(biāo)注后,匯入京東云AI數(shù)據(jù)湖,成為具身智能模型訓(xùn)練的寶貴資源。用真實的物理世界數(shù)據(jù)訓(xùn)練出能理解物理世界的模型,再將模型植入各類機器人,讓機器真正走進物理世界發(fā)揮作用——這正是京東布局的核心邏輯。
這個看似樸素的社區(qū)采集模式背后,是一場政企深度合作的產(chǎn)業(yè)競速。據(jù)宿遷湖濱新區(qū)黨工委書記張先彥透露,該項目從簽約到運營僅用40天時間,創(chuàng)造了當(dāng)?shù)亟蚪驑返赖摹昂I速度”。政府全力協(xié)助項目立項、場地配套、人員招錄,并聯(lián)動本地院校開設(shè)“訂單班”批量輸送采集標(biāo)注人員,著力打造吸引年輕人的社區(qū)以留住人才。
如今,這里已形成“一個中心、若干社區(qū)網(wǎng)格采集點”的格局。位于湖濱新區(qū)的數(shù)采中心配備了30個專業(yè)采集室,覆蓋物流倉儲、工業(yè)制造、健康醫(yī)療、家庭服務(wù)等六大領(lǐng)域場景實驗室,承擔(dān)任務(wù)分發(fā)、人員培訓(xùn)、數(shù)據(jù)回收與質(zhì)檢、真機驗證等綜合功能。而“社區(qū)網(wǎng)格采集”模式則批量部署自研采集終端,在社區(qū)協(xié)助下動員周邊居民、中小企業(yè)在真實作業(yè)場景中開展采集,目前已覆蓋商超、物流、家政、康養(yǎng)、汽修、家裝等眾多領(lǐng)域。下一步,宿遷將發(fā)動超過10萬市民參與,滲透超過百個細分場景,全面朝著“機器人數(shù)據(jù)采集之城”邁進。
選擇宿遷作為首個基地,京東有著多重考量:長三角北翼樞紐的區(qū)位優(yōu)勢、充足的勞動力資源、豐富的制造業(yè)與現(xiàn)代農(nóng)業(yè)場景,以及京東在此深耕多年的產(chǎn)業(yè)生態(tài)。京東已在宿遷累計投資超過200億元,布局全國客服中心、物流中心等14個項目,政企合作基礎(chǔ)深厚。
當(dāng)前,具身智能產(chǎn)業(yè)化的核心瓶頸在于高質(zhì)量實操數(shù)據(jù)嚴(yán)重供給不足。行業(yè)測算顯示,訓(xùn)練一個具備通用泛化能力的具身模型需要至少數(shù)千萬小時的真實場景數(shù)據(jù),而目前全球高質(zhì)量數(shù)據(jù)有效供給僅有數(shù)十萬小時,缺口顯著。
京東瞄準(zhǔn)這一痛點,率先推出覆蓋“采、存、標(biāo)、訓(xùn)、評、仿、測”全鏈路的具身智能數(shù)據(jù)基礎(chǔ)設(shè)施。在數(shù)據(jù)采集之后,京東云AI數(shù)據(jù)湖、JoyBuilder開發(fā)平臺等系統(tǒng)可顯著提升數(shù)據(jù)處理效率;以自采數(shù)據(jù)為核心訓(xùn)練的京東具身大模型JoyAI-RA,真機實驗成功率已處于全球領(lǐng)先水平。今年4月,京東數(shù)據(jù)交易平臺首批高精標(biāo)注數(shù)據(jù)集已定向開放,迅速與國內(nèi)具身智能、多模態(tài)大模型領(lǐng)域的領(lǐng)軍企業(yè)展開合作。
同步建設(shè)的還有以京東物流倉為樣板的具身智能中試基地,預(yù)計6月底交付使用,將打通從數(shù)據(jù)模型到產(chǎn)業(yè)應(yīng)用的“最后一公里”投產(chǎn)驗證。搭載了京東附身智能JoyInside的全新一代機械臂與無人配送車,已在京東618期間規(guī)?;渴?,日均處理數(shù)千萬件非標(biāo)準(zhǔn)包裹,成為業(yè)內(nèi)唯一融入工業(yè)真實場景的具身智能實踐。
從發(fā)動十萬人采集數(shù)據(jù),到構(gòu)建全鏈路數(shù)據(jù)基礎(chǔ)設(shè)施,再到推動機器人在物流、零售、家政等場景真實落地,京東正依托其20余年積累的供應(yīng)鏈產(chǎn)業(yè)厚度,推動AI從虛擬空間大踏步邁向物理世界。海量真實場景數(shù)據(jù)正在成為這場AI物理世界進軍中最稀缺也最堅實的底座。未來,京東具身數(shù)采基礎(chǔ)設(shè)施將持續(xù)擴容,推動京東“全球最大物理世界運營中心”的打造,帶動各地經(jīng)濟發(fā)展和社會就業(yè),助力實現(xiàn)萬億人工智能生態(tài)。