DeepSeek會(huì)在全球AI競(jìng)爭(zhēng)中沉淪嗎 R1升級(jí)回應(yīng)質(zhì)疑

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-06-04 07:40:32 數(shù)據(jù)猿DataYuan

DeepSeek會(huì)在全球AI競(jìng)爭(zhēng)中沉淪嗎 R1升級(jí)回應(yīng)質(zhì)疑。5月28日，DeepSeek小助手在官方交流群中發(fā)布通知稱(chēng)，DeepSeek R1模型已完成小版本試升級(jí)，歡迎用戶(hù)前往官方網(wǎng)頁(yè)、App和小程序測(cè)試。API接口和使用方式保持不變。DeepSeek還在Huggingface上更新了DeepSeek-R1-0528版本，但這并不是從2月就開(kāi)始宣傳的DeepSeek R2版本。

雖然不是DeepSeek R2，但據(jù)眾多網(wǎng)友實(shí)際測(cè)評(píng)，新版DeepSeek R1在性能和體驗(yàn)上有明顯提升。Berkeley背景的代碼測(cè)試平臺(tái)Live CodeBench顯示，DeepSeek-R1-0528當(dāng)前排名第四，不過(guò)這個(gè)榜單沒(méi)有Claude 4。X（Twitter）博主OpenRouterAI也指出，新版上下文長(zhǎng)度更長(zhǎng)，價(jià)格也更高。

此前5月13日，全球最大的大模型整合應(yīng)用平臺(tái)Poe發(fā)布《2025年春季人工智能模型使用趨勢(shì)》報(bào)告。報(bào)告顯示，DeepSeek R1的消息份額從2月中旬的高峰7%下降至4月底的3%，下降超過(guò)50%。Poe的報(bào)告表示，由于其他公司有競(jìng)爭(zhēng)力的推理模型相繼發(fā)布，DeepSeek的影響力似乎已減弱。

此次R1升級(jí)版本的發(fā)布，似乎意在回應(yīng)外界質(zhì)疑，為逐漸冷卻的市場(chǎng)情緒重新“加溫”。此前，多家媒體曾報(bào)道稱(chēng)，DeepSeek計(jì)劃在四月底至五月初發(fā)布新一代R2模型，甚至一度傳出“提前上線(xiàn)”的消息。

5月14日，梁文鋒及其團(tuán)隊(duì)發(fā)布了一篇14頁(yè)論文，詳述在DeepSeek-V3的研發(fā)過(guò)程中，如何借助2048塊H800 GPU實(shí)現(xiàn)超大規(guī)模集群等效訓(xùn)練。人們又開(kāi)始期待R2在架構(gòu)上的繼續(xù)升級(jí)，而此次R1的發(fā)布顯得比較有策略，既回應(yīng)了用戶(hù)期待，又給自己留足了升級(jí)架構(gòu)的時(shí)間。

DeepSeek創(chuàng)始人梁文鋒的故事廣為人知。他從小就展現(xiàn)出數(shù)學(xué)天賦，在浙江大學(xué)本碩畢業(yè)后，對(duì)金融產(chǎn)生了濃厚興趣，與同學(xué)組隊(duì)探索機(jī)器學(xué)習(xí)在全自動(dòng)量化交易中的應(yīng)用，并成功賺取了人生第一桶金。隨后，他創(chuàng)立了幻方量化，迅速在國(guó)內(nèi)量化投資領(lǐng)域嶄露頭角。

梁文鋒很早就注意到AI模型，2018年榮獲中國(guó)私募行業(yè)的最高獎(jiǎng)項(xiàng)——金牛獎(jiǎng)，并在頒獎(jiǎng)典禮上首次系統(tǒng)闡述AI在量化投資中的廣闊前景。他在演講中提到：“量化投資的未來(lái)，是用技術(shù)讓市場(chǎng)更有效率?！?/p>

2019年，幻方量化前瞻性地大規(guī)模布局AI算力，自主研發(fā)“螢火一號(hào)”訓(xùn)練平臺(tái)，投資近2億元，配備1100塊GPU。2021年，投資加碼到10億元的“螢火二號(hào)”投入使用，搭載約1萬(wàn)張英偉達(dá)A100顯卡。憑借這些前期準(zhǔn)備，恰逢2023年AI大模型迎來(lái)爆發(fā)之年，梁文鋒宣布正式進(jìn)軍通用人工智能領(lǐng)域，創(chuàng)辦杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司，即DeepSeek。

DeepSeek采用差異化的技術(shù)路線(xiàn)，開(kāi)發(fā)了新型MLA（多頭潛在注意力機(jī)制）和MoE架構(gòu)，大幅降低顯存占用和推理成本。2024年12月26日，DeepSeek發(fā)布V3模型，使用2048顆H800 GPU，訓(xùn)練成本僅557.6萬(wàn)美元，性能卻超越多個(gè)開(kāi)源模型，被硅谷稱(chēng)為“來(lái)自東方的神秘力量”。

2025年1月20日，DeepSeek發(fā)布R1模型，部分性能可以追趕上當(dāng)時(shí)最先進(jìn)的大模型之一OpenAI o1模型，而且完全開(kāi)源。7天內(nèi)用戶(hù)增長(zhǎng)至1億，登頂中國(guó)和美國(guó)蘋(píng)果應(yīng)用商店免費(fèi)APP榜，超越ChatGPT。R1的成功進(jìn)一步鞏固了DeepSeek的全球影響力，引發(fā)美國(guó)科技股拋售，如英偉達(dá)市值損失了6000億美元。

DeepSeek R1的發(fā)布被業(yè)內(nèi)譽(yù)為“AI的斯普特尼克時(shí)刻”，美國(guó)總統(tǒng)特朗普也給予正面評(píng)價(jià)。NVIDIA CEO黃仁勛稱(chēng)其為“送給全球AI行業(yè)的禮物”，Meta首席科學(xué)家楊立昆肯定其在開(kāi)源和技術(shù)優(yōu)化上的重大突破。微軟、OpenAI、亞馬遜等企業(yè)亦表達(dá)出對(duì)其技術(shù)實(shí)力的認(rèn)可。

DeepSeek的崛起標(biāo)志著中國(guó)AI正從“技術(shù)追隨者”向“自主創(chuàng)新者”轉(zhuǎn)型。然而，這種崛起引起了全球高度警惕。微軟在DeepSeek發(fā)布初期曾在其Azure云服務(wù)上提供接入，但隨后迅速轉(zhuǎn)變態(tài)度，封殺DeepSeek相關(guān)服務(wù)。OpenAI也公開(kāi)指控DeepSeek使用“蒸餾技術(shù)”，涉嫌違反服務(wù)條款，并向美國(guó)政府提交信函，建議實(shí)施AI出口管制。

針對(duì)DeepSeek的新情況，美國(guó)多個(gè)政府部門(mén)開(kāi)始采取限制措施。參議員喬什·霍利提出《美國(guó)人工智能能力與中國(guó)脫鉤法案》，明確禁止美國(guó)個(gè)人或機(jī)構(gòu)下載、使用DeepSeek開(kāi)發(fā)的應(yīng)用程序。其他國(guó)家和地區(qū)也出于國(guó)家安全、數(shù)據(jù)隱私和技術(shù)主權(quán)的考量，禁止在政府機(jī)構(gòu)、公共部門(mén)或關(guān)鍵基礎(chǔ)設(shè)施設(shè)備上安裝或運(yùn)行DeepSeek的相關(guān)應(yīng)用與模型。

對(duì)此，中國(guó)外交部發(fā)言人郭嘉昆回應(yīng)道，中國(guó)政府高度重視并依法保護(hù)數(shù)據(jù)隱私和安全。DeepSeek通過(guò)主動(dòng)公開(kāi)其模型代碼、技術(shù)論文及訓(xùn)練細(xì)節(jié)，以及學(xué)術(shù)界背書(shū)，試圖緩解國(guó)際社會(huì)的質(zhì)疑和壓力。然而，這些應(yīng)對(duì)策略尚不能阻止上述國(guó)家的政府設(shè)備禁令、歐盟的監(jiān)管調(diào)查以及安全漏洞爭(zhēng)議。

在5月28日重新回到公眾視線(xiàn)之前，DeepSeek經(jīng)歷了長(zhǎng)達(dá)三個(gè)月的沉寂期。盡管外界對(duì)梁文鋒的動(dòng)向和團(tuán)隊(duì)的進(jìn)展一無(wú)所知，但競(jìng)爭(zhēng)對(duì)手的行動(dòng)并未停滯。OpenAI很快發(fā)布了o3系列模型，顯著提升了數(shù)學(xué)、科學(xué)和復(fù)雜推理任務(wù)中的表現(xiàn)。Anthropic則于2月推出Claude 3.7 Sonnet，并在5月23日推出了Claude Opus 4和Claude Sonnet 4。Google也在2025年5月的Google I/O大會(huì)上發(fā)布了Gemini 2.5 Pro和Flash版本，表現(xiàn)出色。

DeepSeek R1目前已下滑至權(quán)威大模型評(píng)測(cè)平臺(tái)Chatbot Arena LLM Leaderboard的第9位。根據(jù)手機(jī)下載排名權(quán)威網(wǎng)站Sensor Tower旗下的Data.ai顯示，DeepSeek在全球下載排名中穩(wěn)定在第11位，但在用戶(hù)活躍度、使用時(shí)長(zhǎng)等排名中，前100名均看不到DeepSeek的身影。

DeepSeek市場(chǎng)份額的下滑并非偶然。綜合業(yè)內(nèi)分析與實(shí)測(cè)反饋，原因大致可歸結(jié)為：新旗艦?zāi)Ｐ涂焖傩Q食舊模型；DeepSeek R1的推理速度慢；與大廠(chǎng)生態(tài)基本沒(méi)有綁定。然而，R1 0528版本的發(fā)布展示了DeepSeek在深度思考能力和復(fù)雜推理任務(wù)方面的顯著提升。DeepSeek通過(guò)MIT協(xié)議開(kāi)源R1并構(gòu)建開(kāi)放生態(tài)來(lái)重塑其國(guó)際形象，雖然尚未形成類(lèi)似Meta Llama那樣的“飛輪效應(yīng)”，但如果DeepSeek在性能和工具鏈方面進(jìn)一步實(shí)現(xiàn)突破，并提供更加友好的部署與微調(diào)能力，或許有機(jī)會(huì)繞開(kāi)主流市場(chǎng)封鎖，從全球開(kāi)發(fā)者群體走出一條非典型的國(guó)際增長(zhǎng)曲線(xiàn)。

未來(lái)的征程將是一場(chǎng)圍繞信任與生態(tài)的系統(tǒng)性博弈。DeepSeek的技術(shù)突破固然打開(kāi)了通往全球的大門(mén)，但能否穿越復(fù)雜的國(guó)際環(huán)境、以透明實(shí)踐贏得信任，并構(gòu)建真正開(kāi)放協(xié)作的全球AI生態(tài)，才是其能否引領(lǐng)下一波人工智能浪潮的關(guān)鍵所在。

(責(zé)任編輯：0882)

關(guān)閉

DeepSeek會(huì)在全球AI競(jìng)爭(zhēng)中沉淪嗎 R1升級(jí)回應(yīng)質(zhì)疑

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)