电竞下注-中国电竞赛事及体育赛事平台

中華網(wǎng) china.com

新聞

揭秘DeepSeek內幕,為什么強化學習是下一個 Scaling Law? 創(chuàng)新引領算力革命

關鍵詞:
2025-02-28 10:21:35  新浪財經(jīng)

揭秘DeepSeek內幕,為什么強化學習是下一個 Scaling Law?近期,中國企業(yè)DeepSeek(以下簡稱DS)全面開源了其創(chuàng)新成果,引發(fā)了市場對生成式AI技術發(fā)展與算力硬件需求的熱烈討論。DS的V3版本模型以僅1/10訓練成本消耗便獲得了與海外領先模型GPT-4o/Llama3.3對標的能力,并通過對V3同一基礎模型的后訓練,獲得了能力對齊GPT-o1的R1模型。這種創(chuàng)新在中美貿易摩擦背景下AI硬件采購受限的情況下顯得尤為重要,它并未提出任何反“Scaling Law”的趨勢,而是通過提高全行業(yè)算力資源使用效率來創(chuàng)造更大的需求。

DS V3通過多種方式優(yōu)化算力使用:在MLP層引入稀疏化的MoE架構,只需根據(jù)輸入數(shù)據(jù)特點調動部分專家模型進行處理,無需復用所有參數(shù);引入FP8精度訓練,采用MTP(多token生成)優(yōu)化訓練效率;在后訓練階段簡化模型數(shù)量,優(yōu)化獎勵機制,獨創(chuàng)GRPO算法為強化學習提供方向。

PTX代碼的加持進一步釋放了硬件使用效率。確定創(chuàng)新的模型網(wǎng)絡結構后,有針對性地設計和優(yōu)化AI基礎設施變得迫切。DS團隊具有軟硬件一體化系統(tǒng)性的思考能力,這為其成功提供了重要支持。隨著“大模型平權”帶來的進一步硬件需求釋放,未來AI基礎設施的重要性有望日益凸顯。

MoE結構可能帶來對處理器架構的定制化需求,如更大的計算單元、高效的通信內核和近存計算單元等。雖然大量使用專家并行減少了張量并行,但并不能證明高速互聯(lián)需求在更強基礎模型訓練中呈下降趨勢。國產(chǎn)算力若要運行訓練場景,需對FP8數(shù)據(jù)類型及高算力做好進一步支持。

分析顯示,DeepSeek在模型訓練過程中引入了多項創(chuàng)新。堅定不移延續(xù)MoE路徑,稀疏化架構減少算力消耗。MoE最早在1991年被提出,是一種網(wǎng)絡層結構,主要由專家網(wǎng)絡、門控網(wǎng)絡與選擇器組成。DeepSeek在訓練上采用稀疏MoE架構,其門控機制僅激活少數(shù)設備上的少量專家,在擴大模型容量同時控制訓練資源消耗。

關閉

廣東“最強春招會”提供5萬個職位 吸引12萬學生報名

廣東最強春招會提供5萬個職位2025-03-17 10:33:02

中國航空工業(yè)集團原董事長譚瑞松被捕 涉嫌貪污受賄案進展

中國航空工業(yè)集團原董事長譚瑞松被捕2025-03-17 10:32:40

每天多睡1小時3年體重會輕24斤

每天多睡1小時3年體重會輕24斤2025-03-17 10:32:24

美國男子被熱飲燙傷控訴星巴克獲賠3.6億 天價賠償引發(fā)爭議

美國男子被熱飲燙傷控訴星巴克獲賠3,6億2025-03-17 10:06:44

美空襲也門為以打促談向伊朗施壓 警告信號升級

美空襲也門為以打促談向伊朗施壓2025-03-17 10:08:34

存款變保險?記者臥底:保險銷售冒充銀行職員,建行外泄儲戶信息 銀行與險企合謀設局

存款變保險,記者臥底,保險銷售冒充銀行職員,建行外泄儲戶信息2025-03-17 10:30:51

副教授權威期刊論文全文抄襲?西安交通大學:屬實 學校已解除聘用關系

副教授權威期刊論文全文抄襲,西安交通大學,屬實2025-03-17 10:31:09

NASA稱被困太空宇航員最早19日回地球 結束超9個月滯留

NASA稱被困太空宇航員最早19日回地球2025-03-17 10:31:32

白宮發(fā)特朗普“觀戰(zhàn)”照片 網(wǎng)民批評 和平承諾遭質疑

白宮發(fā)特朗普觀戰(zhàn)照片網(wǎng)民批評2025-03-17 10:15:05

特朗普:解決毒品問題必須恢復死刑

特朗普:解決毒品問題必須恢復死刑2025-03-17 10:11:01

每天多睡1小時3年體重會輕24斤

每天多睡1小時3年體重會輕24斤2025-03-17 10:32:24

官方查封一次性內褲涉事企業(yè) 立即行動嚴肅查處

官方查封一次性內褲涉事企業(yè)2025-03-17 10:26:59

中國航空工業(yè)集團原董事長譚瑞松被捕 涉嫌貪污受賄案進展

中國航空工業(yè)集團原董事長譚瑞松被捕2025-03-17 10:32:40

臺灣屏東市區(qū)凌晨爆發(fā)槍戰(zhàn) 5人受傷警方追緝中

臺灣屏東市區(qū)凌晨爆發(fā)槍戰(zhàn)2025-03-17 10:25:48

太原620名新兵將踏上軍旅征程 青春熱血獻國防

太原620名新兵將踏上軍旅征程2025-03-17 10:13:24

澤連斯基:俄烏沖突領土問題非常復雜 對美官員與普京會晤具體內容一無所知 ?;饤l件成焦點

澤連斯基,俄烏沖突領土問題非常復雜對美官員與普京會晤具體內容一無所知2025-03-17 10:09:10

也門戰(zhàn)局將會如何發(fā)展 美軍行動引發(fā)局勢升級

也門戰(zhàn)局將會如何發(fā)展2025-03-17 10:19:59

男子知假買假獲得10倍賠償

男子知假買假獲得10倍賠償2025-03-17 10:27:22

初醫(yī)生緊急下架所有一次性產(chǎn)品 回應非滅菌問題

初醫(yī)生緊急下架所有一次性產(chǎn)品2025-03-17 10:28:51

金秀賢金賽綸2015年被拍到過

金秀賢金賽綸2015年被拍到過2025-03-17 10:31:37

時間定了!油價即將大跌!

時間定了!油價即將大跌!2025-03-17 10:29:05

海底撈“小便門”后續(xù):客流量受影響 忠實客戶仍在支持

海底撈小便門后續(xù),客流量受影響2025-03-17 10:24:37

專家:美國為何突襲也門胡塞武裝,特朗普在中東再燃戰(zhàn)火?軍事行動升級引發(fā)關注

專家,美國為何突襲也門胡塞武裝,特朗普在中東再燃戰(zhàn)火2025-03-17 10:31:14

美國務卿與俄外長通話 同意繼續(xù)努力恢復美俄溝通 討論胡塞武裝問題

美國務卿與俄外長通話同意繼續(xù)努力恢復美俄溝通2025-03-17 10:32:47

美官員否認美航母遭襲 無人機被成功攔截

美官員否認美航母遭襲2025-03-17 10:25:16

杜特爾特女兒講述:父親要求我立刻回菲律賓 履行國家職責

杜特爾特女兒講述,父親要求我立刻回菲律賓2025-03-17 10:11:20

老鋪黃金“煉金術”調查:排隊黃牛、熟練工匠和被模仿的古法金 高奢平替引關注

老鋪黃金煉金術調查,排隊黃牛,熟練工匠和被模仿的古法金2025-03-17 10:29:22

庫爾斯克戰(zhàn)事持續(xù),澤連斯基:“按需”作戰(zhàn) 烏軍否認被圍困

庫爾斯克戰(zhàn)事持續(xù),澤連斯基,按需作戰(zhàn)2025-03-17 10:09:22

特朗普突然下令開戰(zhàn) 對胡塞武裝發(fā)動空襲 向伊朗發(fā)出強烈信號

特朗普突然下令開戰(zhàn)對胡塞武裝發(fā)動空襲2025-03-17 10:12:10

廣東“最強春招會”提供5萬個職位 吸引12萬學生報名

廣東最強春招會提供5萬個職位2025-03-17 10:33:02

女子路邊撿小孩 孩子哭訴爸爸把媽媽接走了把自己給漏了

女子路邊撿小孩 孩子哭訴被爸爸落下2025-03-17 10:20:58

蜜雪冰城門店被立案調查 違規(guī)操作引關注

蜜雪冰城門店被立案調查2025-03-17 10:29:33

俄總統(tǒng)助理:俄方正在為普京與特朗普會晤做準備 會晤將視需要舉行

俄總統(tǒng)助理,俄方正在為普京與特朗普會晤做準備2025-03-17 10:15:21

加方被批夢游般地陷入與中國貿易戰(zhàn) 雙重壓力下的加拿大困境

加方被批夢游般地陷入與中國貿易戰(zhàn)2025-03-17 10:08:51

相關新聞