DeepSeek 最近發(fā)布了新功能「多模態(tài)識(shí)圖」,距離 V4 發(fā)布僅五天。這個(gè)新功能正在灰度上線,同時(shí) LiveBench 榜單更新顯示 V4 開(kāi)源模型獲得了最高分。此外,API 2.5 的折扣價(jià)也將再延長(zhǎng)一個(gè)月。
陳小康是北大博士,負(fù)責(zé) DeepSeek 的多模態(tài)團(tuán)隊(duì)。他在 4 月 28 日下午發(fā)布了一條帖子,內(nèi)容是「Soon, we see you. ?」,配圖是兩只藍(lán)色鯨魚(yú),其中一只戴著黑色眼罩,另一只睜著眼睛。不久后他刪除了這條帖子,并在 24 小時(shí)后重新發(fā)布了一條類(lèi)似的帖子,改為「Now, we see you. ?」。
同一時(shí)間,DeepSeek 官網(wǎng)和 App 中出現(xiàn)了新的「識(shí)圖模式」選項(xiàng),與「快速模式」和「專(zhuān)家模式」并列。這不是簡(jiǎn)單的 OCR 文字識(shí)別,而是真正的圖像理解。用戶(hù)可以上傳圖片,DeepSeek 能夠描述內(nèi)容、分析場(chǎng)景并回答關(guān)于圖片的問(wèn)題。這項(xiàng)功能目前還在逐步推送中。
DeepSeek 能夠識(shí)別文檔和圖片,但面對(duì)經(jīng)典的「數(shù)手指」問(wèn)題時(shí)未能準(zhǔn)確識(shí)別手指數(shù)量。這道題本身對(duì) AI 來(lái)說(shuō)有一定難度,GPT-5.5 和其他一些模型也未能成功識(shí)別。最新實(shí)測(cè)顯示,北美三大廠商中只有 Gemini 能夠準(zhǔn)確識(shí)別手指數(shù)量。
LiveBench 榜單顯示,V4-Pro 得分為 73.58 分,在全榜排名第 11 位。前 10 名均為閉源模型,包括 GPT-5.5 Thinking xHigh 80.71、GPT-5.4 Thinking xHigh 80.28 和 Gemini 3.1 Pro Preview 79.93 等。開(kāi)源模型中,V4-Pro 的得分最高,比榜首的 GPT-5.5 低 7 分。具體來(lái)看,V4-Pro 在數(shù)學(xué)和推理方面表現(xiàn)較強(qiáng),分別得分為 90.68 和 82.69,編程方面較弱,得分為 69.99。語(yǔ)言理解得分為 78.13,表現(xiàn)尚可。
其他國(guó)產(chǎn)模型如 Kimi K2.6 Thinking 得分為 72.17,Qwen 3.6 Plus 得分為 70.85,GLM 5.1 得分為 70.18,DeepSeek-V4-Flash 得分為 67.25。
V4-Pro 的 2.5 折限時(shí)折扣延長(zhǎng)至 5 月 31 日 23:59。在這期間,V4-Pro API 緩存命中費(fèi)用為 0.025 元/百萬(wàn) tokens,輸入費(fèi)用為 3 元,輸出費(fèi)用為 6 元。建議調(diào)用時(shí)開(kāi)啟 1M 上下文(在模型 ID 后加上 [1m]),并將推理強(qiáng)度設(shè)置為 max,以獲得最佳性能。
最近,一個(gè)名為「caveman」的Claude Code插件在Hacker News上引起了廣泛關(guān)注
2026-04-08 09:21:19Claude防話癆插件爆火Anthropic的產(chǎn)品負(fù)責(zé)人Alex Albert在一次35分鐘的訪談中,首次詳細(xì)披露了Claude模型的研發(fā)全過(guò)程
2026-05-24 17:19:03Anthropic自曝下一代Claude訓(xùn)練內(nèi)幕