电竞下注-中国电竞赛事及体育赛事平台

中華網(wǎng) china.com

新聞

DeepSeek為何發(fā)表研究成果 揭示AI模型秘密

關(guān)鍵詞:
2025-09-20 12:51:47  證券時報網(wǎng)

證券時報的文章內(nèi)容僅供參考,不構(gòu)成實質(zhì)性投資建議,據(jù)此操作風險自擔。下載“證券時報”官方APP或關(guān)注官方微信公眾號,可以隨時了解股市動態(tài),洞察政策信息,把握財富機會。

9月18日,DeepSeek團隊的研究論文《DeepSeek-R1推理模型》登上了國際權(quán)威期刊《自然》的封面。梁文鋒擔任該論文的通訊作者。DeepSeek R1是首個通過同行評議的主要大語言模型,新版論文與今年1月未經(jīng)同行評審的初版有較大差異。

在同行評議過程中,DeepSeek團隊減少了對模型的擬人化描述,并增加了技術(shù)細節(jié)說明,包括訓練數(shù)據(jù)類型和安全性考慮等,回應了關(guān)于知識蒸餾的質(zhì)疑。DeepSeek否認了使用OpenAI模型輸出進行訓練的說法,明確表示DeepSeek-V3 Base(DeepSeek-R1的基座模型)使用的數(shù)據(jù)全部來自互聯(lián)網(wǎng),雖然可能包含GPT-4生成的結(jié)果,但絕非有意而為之,更沒有專門的蒸餾環(huán)節(jié)。為防止基準測試數(shù)據(jù)污染,團隊對DeepSeek-R1的預訓練和后訓練數(shù)據(jù)都實施了全面的去污染措施。

開源之后,R1在Hugging Face上的下載量突破1090萬次,成為全球最受歡迎的開源推理模型之一。DeepSeek首次公開了僅靠強化學習就能激發(fā)大模型推理能力的重要研究成果,啟發(fā)了全球AI研究者。R1的核心創(chuàng)新在于采用了“純強化學習”這一自動化試錯方法,通過獎勵模型達到正確答案的行為來學習推理策略,而非傳統(tǒng)模仿人類預設(shè)的推理模式。補充材料中還首次公布了R1訓練成本僅為29.4萬美元,加上約600萬美元的基礎(chǔ)模型成本,遠低于其他主流AI公司的訓練成本。

今年1月,DeepSeek R1模型發(fā)布時,其卓越的推理能力和極低的開發(fā)成本曾引發(fā)全球科技股大幅下跌。作為全球首個通過同行評審的主流大語言模型,《自然》期刊將該篇論文作為封面論文,并在評論報道文章中表達了贊賞和肯定,認為這標志著中國在大模型基礎(chǔ)研究領(lǐng)域取得重要突破。在AI行業(yè)快速發(fā)展中,未經(jīng)證實的說法和炒作不在少數(shù)?!蹲匀弧冯s志認為,依靠獨立研究人員進行的同行評審是抑制AI行業(yè)過度炒作的有效方式。DeepSeek所做的一切,是非常值得歡迎的先例。

8月21日,DeepSeek正式發(fā)布了最新大語言模型DeepSeek-V3.1。新升級版本的變化主要體現(xiàn)在三個方面:混合推理架構(gòu)、更高的思考效率以及更強的Agent能力。DeepSeek-V3.1實現(xiàn)了一個模型同時支持思考模式與非思考模式。DeepSeek是2023年成立于杭州的人工智能公司,由幻方量化孵化,創(chuàng)始團隊由梁文鋒領(lǐng)銜,成員來自頂尖高校與國際機構(gòu)的技術(shù)專家。

(責任編輯:zhangxiaohua)
關(guān)閉

女子穿吊帶裙遭街拍被配文傳播 侵權(quán)行為被判賠償

女子穿吊帶裙遭街拍被配文傳播2025-10-27 14:08:28

廣東一處沙灘現(xiàn)中華白海豚尸體 疑因難產(chǎn)死亡

廣東一處沙灘現(xiàn)中華白海豚尸體2025-10-27 14:06:40

世界第一美少年"去世:《魂斷威尼斯》成名

"世界第一美少年"去世2025-10-27 14:04:44

泰國王太后辭世赴泰避免這些行為 尊重當?shù)亓曀着c情感

泰國王太后辭世赴泰避免這些行為2025-10-27 13:19:51

解放軍搶灘登陸演練機器狗當先鋒 鋼鐵之軀震撼登場

解放軍搶灘登陸演練機器狗當先鋒2025-10-27 13:44:35

越南國會任命新副總理 范氏清茶成首位女性副總理

越南國會任命新副總理2025-10-27 13:50:07

評論員稱美軍根本不想打委內(nèi)瑞拉 施壓而非開戰(zhàn)

評論員稱美軍根本不想打委內(nèi)瑞拉2025-10-27 13:48:07

抗美援朝烈士姚維新DNA比對成功!

抗美援朝烈士姚維新DNA比對成功2025-10-27 13:32:06

廣東一處沙灘現(xiàn)中華白海豚尸體 疑因難產(chǎn)死亡

廣東一處沙灘現(xiàn)中華白海豚尸體2025-10-27 14:06:40

美兩黨議員呼吁加強博彩監(jiān)管 NBA賭博風波凸顯體育博彩合作風險

美兩黨議員呼吁加強博彩監(jiān)管2025-10-27 14:02:29

本輪預計下調(diào)汽油價格265元/噸 調(diào)價窗口今日開啟

本輪預計下調(diào)汽油價格265元/噸2025-10-27 14:02:51

臺網(wǎng)紅館長怒斥民進黨是歷史的罪人 篡改歷史遺忘抗日

臺網(wǎng)紅館長怒斥民進黨是歷史的罪人2025-10-27 13:53:47

世界第一美少年"去世:《魂斷威尼斯》成名

"世界第一美少年"去世2025-10-27 14:04:44

粉絲給館長念歡迎臺灣小朋友 館長頻頻點頭直呼“有心了”

粉絲給館長念歡迎臺灣小朋友2025-10-27 14:05:34

余承東:享界S9將于11月上市 華為新品即將發(fā)布

余承東,享界S9將于11月上市2025-10-27 13:51:44

深圳一雙層巴士高架橋下遭“剃頭” 事故引發(fā)廣泛關(guān)注

深圳一雙層巴士高架橋下遭剃頭2025-10-27 13:58:48

女子穿吊帶裙遭街拍被配文傳播 侵權(quán)行為被判賠償

女子穿吊帶裙遭街拍被配文傳播2025-10-27 14:08:28

美國政府停擺即將滿月 國會僵局持續(xù)

美國政府停擺即將滿月2025-10-27 13:24:16

菲總統(tǒng)會見高市早苗 南海布局新篇章

菲總統(tǒng)會見高市早苗2025-10-27 13:47:32

鄭智化就“連滾帶爬”表述致歉 呼吁改善殘疾人服務

鄭智化就連滾帶爬表述致歉2025-10-27 13:49:45

學者:美軍老航母硬撐的代價藏不住 造船業(yè)凋敝警示

學者,美軍老航母硬撐的代價藏不住2025-10-27 13:18:03

墜入南海美軍機單價超F(xiàn)35 MH-60R直升機價格驚人

墜入南海美軍機單價超F(xiàn)352025-10-27 13:54:11

廣東連續(xù)7年成為生育第一大省 出生人口再創(chuàng)新高

廣東連續(xù)7年成為生育第一大省2025-10-27 14:04:25

沙特能否成為算力中心 轉(zhuǎn)型中的科技雄心

沙特能否成為算力中心2025-10-27 13:47:50

一周軍評:不再游刃有余的帝國,搞起“金穹”來也是匆匆忙忙 太空反導競賽加劇

一周軍評,不再游刃有余的帝國,搞起金穹來也是匆匆忙忙2025-10-27 13:52:20

印度女醫(yī)生遭警察性侵后自殺 遺書控訴虐待

印度女醫(yī)生遭警察性侵后自殺2025-10-27 14:00:35

2025未來科學大獎在香港頒獎 科學與藝術(shù)共融盛典

2025未來科學大獎在香港頒獎2025-10-27 13:49:16

體操世錦賽雙杠決賽,鄒敬園沖擊歷史第一人!侍聰單挑6強敵

鄒敬園未來還想開創(chuàng)第一2025-10-27 13:47:21

28日美空管人員將完全領(lǐng)不到工資 航班延誤或加劇

28日美空管人員將完全領(lǐng)不到工資2025-10-27 13:40:31

黃金開盤后突然跳水 貿(mào)易局勢影響市場

黃金開盤后突然跳水2025-10-27 13:54:12

“世界第一美少年”伯恩·安德森去世,享年70歲,曾出演《魂斷威尼斯》 一生的美麗與悲劇

世界第一美少年伯恩·安德森去世,享年70歲,曾出演魂斷威尼斯2025-10-27 14:00:03

女子被家暴 等民警來后狂扇丈夫 家庭矛盾引發(fā)熱議

女子被家暴等民警來后狂扇丈夫2025-10-27 13:56:37

鄭麗文喊話朱立倫趙少康 促藍軍大團結(jié)

鄭麗文喊話朱立倫趙少康2025-10-27 13:49:33

相關(guān)新聞