“雷軍千萬年薪要挖"的DeepSeek羅福莉官宣加入小米 共赴AGI未來!11月12日,前DeepSeek研究員羅福莉加入小米。她在朋友圈發(fā)文表示:“智能終將從語言邁向物理世界。我正在Xiaomi MiMo,和一群富有創(chuàng)造力、才華橫溢且真誠熱愛的研究員,致力于構(gòu)建這樣的未來,全力奔赴我們心目中的AGI?!?/p>

今年10月,小米AI團隊與北京大學(xué)聯(lián)合發(fā)布了一篇關(guān)于MoE與強化學(xué)習的論文,其中已經(jīng)出現(xiàn)羅福莉的名字。Xiaomi MiMo是小米首個推理大模型,羅福莉的加入也是對此前傳言的回應(yīng)。

2024年底,DeepSeek發(fā)布了新一代大語言模型DeepSeek-V3,并宣布開源。該模型在AI圈爆火后,作為DeepSeek-V2關(guān)鍵開發(fā)者之一的羅福莉走進大眾視野,被稱為95后AI“天才少女”。羅福莉本科就讀于北京師范大學(xué)計算機專業(yè),碩士畢業(yè)于北京大學(xué)計算語言學(xué)專業(yè)。
碩士畢業(yè)后,羅福莉先是在阿里達摩院從事預(yù)訓(xùn)練語言模型相關(guān)的工作,負責AliceMind開源項目并主導(dǎo)開發(fā)了多語言預(yù)訓(xùn)練模型VECO。2022年,她加入幻方量化從事深度學(xué)習相關(guān)策略建模和算法研究,之后又跳槽到DeepSeek擔任深度學(xué)習研究員,參與研發(fā)MoE大模型DeepSeek-V2。
就在DeepSeek-V3發(fā)布前幾天,小米創(chuàng)始人雷軍已開出千萬元年薪招聘羅福莉,領(lǐng)導(dǎo)小米AI大模型團隊。當時有消息稱,小米公司正在積極搭建自己的GPU萬卡集群,以加大對AI大模型的投入力度。小米大模型團隊在成立之初就已擁有6500張GPU資源,此次搭建GPU萬卡集群將進一步提升小米在AI大模型領(lǐng)域的研發(fā)實力。據(jù)知情人士透露,該計劃已經(jīng)實施數(shù)月之久,雷軍在其中扮演了重要角色,認為手機是AI硬件領(lǐng)域的核心,小米必須全力以赴。
今年4月,小米開源了首個為推理而生的大模型“Xiaomi MiMo”。在數(shù)學(xué)推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上,MiMo僅用7B的參數(shù)規(guī)模,超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規(guī)模的開源推理模型 QwQ-32B-Preview。MiMo是全新成立不久的小米大模型Core團隊的初步嘗試。小米大模型Core團隊稱,“2025年雖看似是大模型逐夢的后半程,但堅信AGI的征途仍漫長。我們將從務(wù)實創(chuàng)新出發(fā),勇敢探索未知,用思考突破智能邊界,用創(chuàng)造回應(yīng)每一次好奇?!?/p>