站在系統(tǒng)架構(gòu)的視角看,DeepSeek對(duì)Agent的理解已經(jīng)明顯超出“給模型加個(gè)自動(dòng)化殼子”的層面,更接近于把Agent當(dāng)作“模型操作系統(tǒng)”的一部分。模型本體是內(nèi)核,Agent是圍繞內(nèi)核調(diào)度資源的執(zhí)行層,外部工具則像是一個(gè)個(gè)模塊化驅(qū)動(dòng)。誰(shuí)能先把這套“模型OS+Agent標(biāo)準(zhǔn)”跑通并跑穩(wěn),誰(shuí)就可能搶先拿到下一階段生態(tài)的主導(dǎo)權(quán)。
也因此,DeepSeek這次不只是實(shí)現(xiàn)了“交錯(cuò)式思考+工具使用”的技術(shù)路徑,還刻意給這套范式起了一個(gè)明確的名字——“Thinking in Tool-Use”。這既是技術(shù)標(biāo)簽,也是對(duì)未來(lái)平臺(tái)規(guī)則的一種預(yù)埋。
對(duì)于整個(gè)行業(yè)來(lái)說(shuō),這標(biāo)志著一個(gè)不太容易回頭的分界線:Agent不再是“可選項(xiàng)”,而開始變成大模型中長(zhǎng)期競(jìng)爭(zhēng)力的必要組成。未來(lái)看一款模型,不再只是看它在標(biāo)準(zhǔn)榜單上的分?jǐn)?shù),更要看它在真實(shí)環(huán)境里的執(zhí)行鏈條和Agent表現(xiàn)。
當(dāng)然,哪怕有V3.2和Speciale這一波高光表現(xiàn),DeepSeek并沒有掩飾開源與閉源之間仍然存在的現(xiàn)實(shí)差距。
一方面,在世界知識(shí)的廣度和最新信息的覆蓋上,開源模型受限于數(shù)據(jù)獲取渠道和更新頻率,短期內(nèi)很難與手握巨大私有數(shù)據(jù)池的閉源巨頭完全持平。另一方面,在極端復(fù)雜任務(wù)(例如跨領(lǐng)域、多階段專業(yè)決策)以及token生成效率上,開源體系仍然處于被動(dòng)追趕的位置。
DeepSeek選擇承認(rèn)這些不利因素,然后把精力押在“后訓(xùn)練戰(zhàn)術(shù)”上:既然參數(shù)規(guī)模和預(yù)訓(xùn)練預(yù)算追不上,就盡可能把后訓(xùn)練過程做深、做精。
為此,它設(shè)計(jì)了被內(nèi)部稱為“后訓(xùn)練三板斧”的組合:專家蒸餾、多軌強(qiáng)化學(xué)習(xí),以及工具思維融合。
10月20日,人工智能團(tuán)隊(duì)DeepSeek AI發(fā)布了全新多模態(tài)模型 DeepSeek-OCR
2025-10-20 20:33:14DeepSeek開源新模型DeepSeek-OCR