DeepSeek新模型讓硅谷“失眠” 開源陣營(yíng)的“反擊夜”(5)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-12-04 13:38:15 澎湃

站在系統(tǒng)架構(gòu)的視角看，DeepSeek對(duì)Agent的理解已經(jīng)明顯超出“給模型加個(gè)自動(dòng)化殼子”的層面，更接近于把Agent當(dāng)作“模型操作系統(tǒng)”的一部分。模型本體是內(nèi)核，Agent是圍繞內(nèi)核調(diào)度資源的執(zhí)行層，外部工具則像是一個(gè)個(gè)模塊化驅(qū)動(dòng)。誰(shuí)能先把這套“模型OS+Agent標(biāo)準(zhǔn)”跑通并跑穩(wěn)，誰(shuí)就可能搶先拿到下一階段生態(tài)的主導(dǎo)權(quán)。

也因此，DeepSeek這次不只是實(shí)現(xiàn)了“交錯(cuò)式思考+工具使用”的技術(shù)路徑，還刻意給這套范式起了一個(gè)明確的名字——“Thinking in Tool-Use”。這既是技術(shù)標(biāo)簽，也是對(duì)未來(lái)平臺(tái)規(guī)則的一種預(yù)埋。

對(duì)于整個(gè)行業(yè)來(lái)說(shuō)，這標(biāo)志著一個(gè)不太容易回頭的分界線：Agent不再是“可選項(xiàng)”，而開始變成大模型中長(zhǎng)期競(jìng)爭(zhēng)力的必要組成。未來(lái)看一款模型，不再只是看它在標(biāo)準(zhǔn)榜單上的分?jǐn)?shù)，更要看它在真實(shí)環(huán)境里的執(zhí)行鏈條和Agent表現(xiàn)。

當(dāng)然，哪怕有V3.2和Speciale這一波高光表現(xiàn)，DeepSeek并沒有掩飾開源與閉源之間仍然存在的現(xiàn)實(shí)差距。

一方面，在世界知識(shí)的廣度和最新信息的覆蓋上，開源模型受限于數(shù)據(jù)獲取渠道和更新頻率，短期內(nèi)很難與手握巨大私有數(shù)據(jù)池的閉源巨頭完全持平。另一方面，在極端復(fù)雜任務(wù)（例如跨領(lǐng)域、多階段專業(yè)決策）以及token生成效率上，開源體系仍然處于被動(dòng)追趕的位置。

DeepSeek選擇承認(rèn)這些不利因素，然后把精力押在“后訓(xùn)練戰(zhàn)術(shù)”上：既然參數(shù)規(guī)模和預(yù)訓(xùn)練預(yù)算追不上，就盡可能把后訓(xùn)練過程做深、做精。

為此，它設(shè)計(jì)了被內(nèi)部稱為“后訓(xùn)練三板斧”的組合：專家蒸餾、多軌強(qiáng)化學(xué)習(xí)，以及工具思維融合。

首頁(yè)上一頁(yè)...2 3 456 7 全文共 7 頁(yè)下一頁(yè)

關(guān)閉

DeepSeek新模型讓硅谷“失眠” 開源陣營(yíng)的“反擊夜”(5)

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)