2025年年底,本以為全球大模型的話題中心已經被Google牢牢搶走。Gemini 3 Pro上線后,在一系列權威評測中壓制所有開源模型,閉源陣營重新站上技術制高點,“開源是不是到頭了”“Scaling Law是不是撞墻了”的聲音在業(yè)內此起彼伏,開源社區(qū)一度彌漫出一種隱隱的低氣壓。
就在這種節(jié)點上,DeepSeek沒有選擇退到邊線觀望,而是把牌一口氣攤在桌面上。12月1日,它直接拋出兩款新模型:在推理能力上對標GPT-5、整體表現逼近Gemini 3 Pro的DeepSeek-V3.2,以及在數學、邏輯和復雜多輪工具調用上表現異常突出的Speciale版本。這既是一次集中秀肌肉,也是對“閉源新天花板”的正面回應——而且是在算力資源并不占優(yōu)的前提下。
換句話說,這已經不是一次常規(guī)意義上的“版本升級”,而更像是DeepSeek對“后Scaling時代”路線的一次公開下注:當繼續(xù)簡單堆規(guī)模不再是唯一答案,如何憑架構和訓練方式把差距補回來?如何用更少的token,跑出更像“智能體”、而不是“聊天補全器”的行為?以及——為何要在開源陣營中第一個把Agent抬到戰(zhàn)略高度?
圍繞這些問題,DeepSeek給出了一套相對完整的技術路徑和系統(tǒng)敘事。
在大模型的第一陣營里,開源一直被認為“最多追平,難以對抗”。這一次,DeepSeek-V3.2交出來的成績單,已經不太像傳統(tǒng)意義上的追趕者。
按照DeepSeek對外披露的數據,V3.2在公開推理類評測中的整體表現,已經可以與GPT-5同場對比,僅在少數項目上略遜于Gemini 3 Pro。在多項關鍵指標上,它穩(wěn)定超越Kimi-K2-Thinking,刷新國內開源模型推理能力的最好紀錄。在數學計算、復雜邏輯、多步推演等任務上,V3.2已經具備和領先閉源模型掰手腕的實力,基本站到了“全球第二梯隊”的前排位置。
DeepSeek最新發(fā)布的開源數學模型DeepSeekMath-V2,在全球最難的高中數學競賽中達到了金牌水平,成為首個實現這一成就的開源模型,標志著開源人工智能在復雜推理能力上的一次重大突破
2025-11-28 15:24:50DeepSeek新模型有多猛11月27日晚,DeepSeek在Hugging Face上開源了一個新模型:DeepSeek-Math-V2。這是一個數學模型,也是目前首個達到IMO金牌水平且開源的模型
2025-11-28 10:26:50DeepSeek推出新模型10月20日,人工智能團隊DeepSeek AI發(fā)布了全新多模態(tài)模型 DeepSeek-OCR
2025-10-20 20:33:14DeepSeek開源新模型DeepSeek-OCR證券時報的文章內容僅供參考,不構成實質性投資建議,據此操作風險自擔。下載“證券時報”官方APP或關注官方微信公眾號,可以隨時了解股市動態(tài),洞察政策信息,把握財富機會
2025-09-20 12:51:47DeepSeek為何發(fā)表研究成果