电竞下注-中国电竞赛事及体育赛事平台

中華網(wǎng) china.com

新聞

媒體:DeepSeek不需要被神話 理性看待其成就

關(guān)鍵詞:
2025-01-27 22:44:21  界面新聞

1月27日,DeepSeek AI智能助手登上中美iOS免費應(yīng)用排行榜榜首,這是中國應(yīng)用首次取得這一成績。與此同時,與該公司相關(guān)的多個詞條進入微博熱搜,其中一條是“DeepSeek徹底爆發(fā)”。這背后反映了開源模型追趕甚至超越閉源模型的情緒。

事實上,DeepSeek在這幾天并沒有特別的動作,將其推上輿論中心的力量主要來自Meta。三天前,在美國匿名職場社區(qū)teamblind上,有Meta員工表示,DeepSeek的低成本訓(xùn)練工作讓Meta的生成式AI團隊感到恐慌,工程師們正努力分析DeepSeek,試圖從中復(fù)制任何可能的東西。隨后,Meta首席人工智能科學(xué)家楊立昆在X平臺上表示,對于認為“中國在人工智能領(lǐng)域正在超越美國”的人,正確的看法是“開源模型正在超越閉源模型”。

DeepSeek并不是突然崛起。從DeepSeek-V2開始,這家公司已被硅谷視為一股神秘力量。它在國內(nèi)大模型行業(yè)率先發(fā)起了一場真正意義上的“降價潮”,憑借“MoE+MLA”架構(gòu)創(chuàng)新實現(xiàn)了成本降低。近期熱議的原因在于它在過去一個月內(nèi)相繼發(fā)布了DeepSeek-V3和R1兩款大模型產(chǎn)品。

2024年底,DeepSeek發(fā)布新一代MoE模型DeepSeek-V3,擁有6710億參數(shù),激活參數(shù)為370億,在14.8萬億token上進行了預(yù)訓(xùn)練。V3在知識類任務(wù)上接近當前表現(xiàn)最好的Claude-3.5-Sonnet-1022,在代碼能力上稍好于后者,并且在數(shù)學(xué)能力上領(lǐng)先其他開閉源模型。更重要的是,DeepSeek-V3的總訓(xùn)練成本僅為557.6萬美元,完整訓(xùn)練消耗了278.8萬個GPU小時,幾乎是同等性能水平模型所需成本的十分之一。

一周前,DeepSeek發(fā)布了推理模型R1,其性能對齊OpenAI-o1正式版,并同步開源模型權(quán)重。R1在多項任務(wù)上與OpenAI-o1-1217基本持平,尤其在AIME 2024、MATH-500、SWE-Bench Verified三項測試集上以微弱優(yōu)勢取勝。此外,R1還開源了僅通過強化學(xué)習(xí)訓(xùn)練的大語言模型R1-Zero,盡管沒有人類監(jiān)督數(shù)據(jù)介入,但該模型足以對標OpenAI-o1-0912,探索出僅通過強化學(xué)習(xí)就能獲得推理能力的技術(shù)可能性。

關(guān)閉

金價連漲7周后“跳水” 金店再現(xiàn)買金熱

金價連漲7周后跳水2025-02-18 14:00:44

私家車占人行道家長擔(dān)憂孩子走車道 社區(qū)回應(yīng):將安裝U型桿或石球

私家車占人行道家長擔(dān)憂孩子走車道2025-02-18 13:59:27

武漢一培訓(xùn)機構(gòu)請千名學(xué)生看哪吒2 放松身心緩解壓力

武漢一培訓(xùn)機構(gòu)請千名學(xué)生看哪吒22025-02-18 13:50:19

張睿發(fā)尋物啟事找眼鏡,張睿沒眼鏡上不了課

張睿發(fā)尋物啟事找眼鏡2025-02-18 13:54:41

網(wǎng)紅高收入合理嗎?顧茜茜稱每天躺賺30萬是氣話

網(wǎng)紅高收入合理嗎2025-02-18 13:45:21

私家車占人行道家長擔(dān)憂孩子走車道 社區(qū)回應(yīng):將安裝U型桿或石球

私家車占人行道家長擔(dān)憂孩子走車道2025-02-18 13:59:27

特朗普批波音總統(tǒng)專機還沒造好 項目拖延引不滿

特朗普批波音總統(tǒng)專機還沒造好2025-02-18 13:31:20

馬斯克坐實AI游戲工作室計劃 讓游戲再次偉大

馬斯克坐實AI游戲工作室計劃2025-02-18 13:19:44

伊朗:反對外國勢力干涉敘利亞 支持敘人民自決權(quán)

伊朗,反對外國勢力干涉敘利亞2025-02-18 13:33:51

美為何提議從中國向烏派遣維和人員 美國的奇葩主意

美為何提議從中國向烏派遣維和人員2025-02-18 13:14:02

美國翻臉后,歐洲從“夸夸其談的少年”走向獨立成熟要做三件事 應(yīng)對三大危機

美國翻臉后,歐洲從夸夸其談的少年走向獨立成熟要做三件事2025-02-18 13:29:52

今日雨水節(jié)氣,老傳統(tǒng)“吃二樣,做二事,忌二事” 千年習(xí)俗的智慧

今日雨水節(jié)氣,老傳統(tǒng)吃二樣,做二事,忌二事2025-02-18 13:55:02

馬斯克查賬“美國社?!?,稱發(fā)現(xiàn)360歲老人?

馬斯克查賬“美國社保”,稱發(fā)現(xiàn)360歲老人?2025-02-18 13:45:10

光線傳媒再度巨震 高位人氣股走弱

光線傳媒再度巨震2025-02-18 13:45:40

美客機翻覆現(xiàn)場視頻曝光 惡劣天氣或成事故主因

美客機翻覆現(xiàn)場視頻曝光2025-02-18 13:20:05

媒體批特朗普又一次“搶劫”臺灣 美國的真實意圖暴露

媒體批特朗普又一次搶劫臺灣2025-02-18 13:15:58

觀察:2025年的Mini LED電視市場,怎么打? 三大競爭焦點浮現(xiàn)

觀察,2025年的MiniLED電視市場,怎么打2025-02-18 13:57:25

拉夫羅夫抵達沙特 單手揣兜下飛機 談判桌上的博弈

拉夫羅夫抵達沙特單手揣兜下飛機2025-02-18 13:13:44

美俄談判今日開始 澤連斯基:不承認 烏克蘭缺席引發(fā)爭議

美俄談判今日開始澤連斯基,不承認2025-02-18 13:20:24

美國新版“空軍一號”再度延期交付 供應(yīng)鏈問題拖累進度

美國新版空軍一號再度延期交付2025-02-18 13:51:02

哪吒2主創(chuàng)團隊已進入新創(chuàng)作周期 續(xù)寫神話新篇章

哪吒2主創(chuàng)團隊已進入新創(chuàng)作周期2025-02-18 13:47:55

烏方將不承認美俄談判達成的協(xié)議 澤連斯基堅決立場

烏方將不承認美俄談判達成的協(xié)議2025-02-18 13:52:32

未來三天南方陰雨濕冷感明顯 北方降水增多

未來三天南方陰雨濕冷感明顯2025-02-18 13:52:04

哈薩克斯坦鈾出口重心東移 哈鈾售中俄后致歐美快斷供了

哈鈾售中俄后致歐美快斷供了2025-02-18 13:53:48

曝王大陸涉嫌逃兵役被捕

曝王大陸涉嫌逃兵役被捕,王大陸被捕2025-02-18 13:57:04

黑中介騙取巨額服務(wù)費被公訴 虛假承諾誘騙客戶

黑中介騙取巨額服務(wù)費被公訴2025-02-18 13:54:23

以民眾持續(xù)抗議要求政府維持?;?呼吁釋放被扣押人員

以民眾持續(xù)抗議要求政府維持?;?/span>2025-02-18 13:44:58

為了增加軍費,英國公共服務(wù)部門被曝準備削減11%的預(yù)算,歐洲派兵計劃陷入僵局

為了增加軍費,英國公共服務(wù)部門被曝準備削減11%的預(yù)算2025-02-18 13:50:26

大V:歐洲和烏克蘭遭受三次沉重打擊 西方暴露三大問題

大V,歐洲和烏克蘭遭受三次沉重打擊2025-02-18 13:13:27

金價連漲7周后“跳水” 金店再現(xiàn)買金熱

金價連漲7周后跳水2025-02-18 14:00:44

澤連斯基將到訪沙特 不參與美俄會談

澤連斯基將到訪沙特2025-02-18 13:34:14

相關(guān)新聞