DeepSeek會(huì)在全球AI競(jìng)爭(zhēng)中沉淪嗎 R1升級(jí)回應(yīng)質(zhì)疑。5月28日,DeepSeek小助手在官方交流群中發(fā)布通知稱(chēng),DeepSeek R1模型已完成小版本試升級(jí),歡迎用戶(hù)前往官方網(wǎng)頁(yè)、App和小程序測(cè)試。API接口和使用方式保持不變。DeepSeek還在Huggingface上更新了DeepSeek-R1-0528版本,但這并不是從2月就開(kāi)始宣傳的DeepSeek R2版本。
雖然不是DeepSeek R2,但據(jù)眾多網(wǎng)友實(shí)際測(cè)評(píng),新版DeepSeek R1在性能和體驗(yàn)上有明顯提升。Berkeley背景的代碼測(cè)試平臺(tái)Live CodeBench顯示,DeepSeek-R1-0528當(dāng)前排名第四,不過(guò)這個(gè)榜單沒(méi)有Claude 4。X(Twitter)博主OpenRouterAI也指出,新版上下文長(zhǎng)度更長(zhǎng),價(jià)格也更高。
此前5月13日,全球最大的大模型整合應(yīng)用平臺(tái)Poe發(fā)布《2025年春季人工智能模型使用趨勢(shì)》報(bào)告。報(bào)告顯示,DeepSeek R1的消息份額從2月中旬的高峰7%下降至4月底的3%,下降超過(guò)50%。Poe的報(bào)告表示,由于其他公司有競(jìng)爭(zhēng)力的推理模型相繼發(fā)布,DeepSeek的影響力似乎已減弱。
此次R1升級(jí)版本的發(fā)布,似乎意在回應(yīng)外界質(zhì)疑,為逐漸冷卻的市場(chǎng)情緒重新“加溫”。此前,多家媒體曾報(bào)道稱(chēng),DeepSeek計(jì)劃在四月底至五月初發(fā)布新一代R2模型,甚至一度傳出“提前上線(xiàn)”的消息。
5月14日,梁文鋒及其團(tuán)隊(duì)發(fā)布了一篇14頁(yè)論文,詳述在DeepSeek-V3的研發(fā)過(guò)程中,如何借助2048塊H800 GPU實(shí)現(xiàn)超大規(guī)模集群等效訓(xùn)練。人們又開(kāi)始期待R2在架構(gòu)上的繼續(xù)升級(jí),而此次R1的發(fā)布顯得比較有策略,既回應(yīng)了用戶(hù)期待,又給自己留足了升級(jí)架構(gòu)的時(shí)間。
DeepSeek創(chuàng)始人梁文鋒的故事廣為人知。他從小就展現(xiàn)出數(shù)學(xué)天賦,在浙江大學(xué)本碩畢業(yè)后,對(duì)金融產(chǎn)生了濃厚興趣,與同學(xué)組隊(duì)探索機(jī)器學(xué)習(xí)在全自動(dòng)量化交易中的應(yīng)用,并成功賺取了人生第一桶金。隨后,他創(chuàng)立了幻方量化,迅速在國(guó)內(nèi)量化投資領(lǐng)域嶄露頭角。
梁文鋒很早就注意到AI模型,2018年榮獲中國(guó)私募行業(yè)的最高獎(jiǎng)項(xiàng)——金牛獎(jiǎng),并在頒獎(jiǎng)典禮上首次系統(tǒng)闡述AI在量化投資中的廣闊前景。他在演講中提到:“量化投資的未來(lái),是用技術(shù)讓市場(chǎng)更有效率?!?/p>
2019年,幻方量化前瞻性地大規(guī)模布局AI算力,自主研發(fā)“螢火一號(hào)”訓(xùn)練平臺(tái),投資近2億元,配備1100塊GPU。2021年,投資加碼到10億元的“螢火二號(hào)”投入使用,搭載約1萬(wàn)張英偉達(dá)A100顯卡。憑借這些前期準(zhǔn)備,恰逢2023年AI大模型迎來(lái)爆發(fā)之年,梁文鋒宣布正式進(jìn)軍通用人工智能領(lǐng)域,創(chuàng)辦杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,即DeepSeek。
DeepSeek采用差異化的技術(shù)路線(xiàn),開(kāi)發(fā)了新型MLA(多頭潛在注意力機(jī)制)和MoE架構(gòu),大幅降低顯存占用和推理成本。2024年12月26日,DeepSeek發(fā)布V3模型,使用2048顆H800 GPU,訓(xùn)練成本僅557.6萬(wàn)美元,性能卻超越多個(gè)開(kāi)源模型,被硅谷稱(chēng)為“來(lái)自東方的神秘力量”。
2025年1月20日,DeepSeek發(fā)布R1模型,部分性能可以追趕上當(dāng)時(shí)最先進(jìn)的大模型之一OpenAI o1模型,而且完全開(kāi)源。7天內(nèi)用戶(hù)增長(zhǎng)至1億,登頂中國(guó)和美國(guó)蘋(píng)果應(yīng)用商店免費(fèi)APP榜,超越ChatGPT。R1的成功進(jìn)一步鞏固了DeepSeek的全球影響力,引發(fā)美國(guó)科技股拋售,如英偉達(dá)市值損失了6000億美元。
DeepSeek R1的發(fā)布被業(yè)內(nèi)譽(yù)為“AI的斯普特尼克時(shí)刻”,美國(guó)總統(tǒng)特朗普也給予正面評(píng)價(jià)。NVIDIA CEO黃仁勛稱(chēng)其為“送給全球AI行業(yè)的禮物”,Meta首席科學(xué)家楊立昆肯定其在開(kāi)源和技術(shù)優(yōu)化上的重大突破。微軟、OpenAI、亞馬遜等企業(yè)亦表達(dá)出對(duì)其技術(shù)實(shí)力的認(rèn)可。
DeepSeek的崛起標(biāo)志著中國(guó)AI正從“技術(shù)追隨者”向“自主創(chuàng)新者”轉(zhuǎn)型。然而,這種崛起引起了全球高度警惕。微軟在DeepSeek發(fā)布初期曾在其Azure云服務(wù)上提供接入,但隨后迅速轉(zhuǎn)變態(tài)度,封殺DeepSeek相關(guān)服務(wù)。OpenAI也公開(kāi)指控DeepSeek使用“蒸餾技術(shù)”,涉嫌違反服務(wù)條款,并向美國(guó)政府提交信函,建議實(shí)施AI出口管制。
針對(duì)DeepSeek的新情況,美國(guó)多個(gè)政府部門(mén)開(kāi)始采取限制措施。參議員喬什·霍利提出《美國(guó)人工智能能力與中國(guó)脫鉤法案》,明確禁止美國(guó)個(gè)人或機(jī)構(gòu)下載、使用DeepSeek開(kāi)發(fā)的應(yīng)用程序。其他國(guó)家和地區(qū)也出于國(guó)家安全、數(shù)據(jù)隱私和技術(shù)主權(quán)的考量,禁止在政府機(jī)構(gòu)、公共部門(mén)或關(guān)鍵基礎(chǔ)設(shè)施設(shè)備上安裝或運(yùn)行DeepSeek的相關(guān)應(yīng)用與模型。
對(duì)此,中國(guó)外交部發(fā)言人郭嘉昆回應(yīng)道,中國(guó)政府高度重視并依法保護(hù)數(shù)據(jù)隱私和安全。DeepSeek通過(guò)主動(dòng)公開(kāi)其模型代碼、技術(shù)論文及訓(xùn)練細(xì)節(jié),以及學(xué)術(shù)界背書(shū),試圖緩解國(guó)際社會(huì)的質(zhì)疑和壓力。然而,這些應(yīng)對(duì)策略尚不能阻止上述國(guó)家的政府設(shè)備禁令、歐盟的監(jiān)管調(diào)查以及安全漏洞爭(zhēng)議。
在5月28日重新回到公眾視線(xiàn)之前,DeepSeek經(jīng)歷了長(zhǎng)達(dá)三個(gè)月的沉寂期。盡管外界對(duì)梁文鋒的動(dòng)向和團(tuán)隊(duì)的進(jìn)展一無(wú)所知,但競(jìng)爭(zhēng)對(duì)手的行動(dòng)并未停滯。OpenAI很快發(fā)布了o3系列模型,顯著提升了數(shù)學(xué)、科學(xué)和復(fù)雜推理任務(wù)中的表現(xiàn)。Anthropic則于2月推出Claude 3.7 Sonnet,并在5月23日推出了Claude Opus 4和Claude Sonnet 4。Google也在2025年5月的Google I/O大會(huì)上發(fā)布了Gemini 2.5 Pro和Flash版本,表現(xiàn)出色。
DeepSeek R1目前已下滑至權(quán)威大模型評(píng)測(cè)平臺(tái)Chatbot Arena LLM Leaderboard的第9位。根據(jù)手機(jī)下載排名權(quán)威網(wǎng)站Sensor Tower旗下的Data.ai顯示,DeepSeek在全球下載排名中穩(wěn)定在第11位,但在用戶(hù)活躍度、使用時(shí)長(zhǎng)等排名中,前100名均看不到DeepSeek的身影。
DeepSeek市場(chǎng)份額的下滑并非偶然。綜合業(yè)內(nèi)分析與實(shí)測(cè)反饋,原因大致可歸結(jié)為:新旗艦?zāi)P涂焖傩Q食舊模型;DeepSeek R1的推理速度慢;與大廠(chǎng)生態(tài)基本沒(méi)有綁定。然而,R1 0528版本的發(fā)布展示了DeepSeek在深度思考能力和復(fù)雜推理任務(wù)方面的顯著提升。DeepSeek通過(guò)MIT協(xié)議開(kāi)源R1并構(gòu)建開(kāi)放生態(tài)來(lái)重塑其國(guó)際形象,雖然尚未形成類(lèi)似Meta Llama那樣的“飛輪效應(yīng)”,但如果DeepSeek在性能和工具鏈方面進(jìn)一步實(shí)現(xiàn)突破,并提供更加友好的部署與微調(diào)能力,或許有機(jī)會(huì)繞開(kāi)主流市場(chǎng)封鎖,從全球開(kāi)發(fā)者群體走出一條非典型的國(guó)際增長(zhǎng)曲線(xiàn)。
未來(lái)的征程將是一場(chǎng)圍繞信任與生態(tài)的系統(tǒng)性博弈。DeepSeek的技術(shù)突破固然打開(kāi)了通往全球的大門(mén),但能否穿越復(fù)雜的國(guó)際環(huán)境、以透明實(shí)踐贏得信任,并構(gòu)建真正開(kāi)放協(xié)作的全球AI生態(tài),才是其能否引領(lǐng)下一波人工智能浪潮的關(guān)鍵所在。
中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)在短短一個(gè)月內(nèi)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 19:35:39DeepSeek為何引發(fā)全球轟動(dòng)