Claude畫(huà)的DeepSeek藍(lán)胖魚(yú) 多模態(tài)識(shí)圖新功能上線

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2026-05-02 13:07:49 新浪財(cái)經(jīng)

DeepSeek 最近發(fā)布了新功能「多模態(tài)識(shí)圖」，距離 V4 發(fā)布僅五天。這個(gè)新功能正在灰度上線，同時(shí) LiveBench 榜單更新顯示 V4 開(kāi)源模型獲得了最高分。此外，API 2.5 的折扣價(jià)也將再延長(zhǎng)一個(gè)月。

陳小康是北大博士，負(fù)責(zé) DeepSeek 的多模態(tài)團(tuán)隊(duì)。他在 4 月 28 日下午發(fā)布了一條帖子，內(nèi)容是「Soon, we see you. ?」，配圖是兩只藍(lán)色鯨魚(yú)，其中一只戴著黑色眼罩，另一只睜著眼睛。不久后他刪除了這條帖子，并在 24 小時(shí)后重新發(fā)布了一條類(lèi)似的帖子，改為「Now, we see you. ?」。

同一時(shí)間，DeepSeek 官網(wǎng)和 App 中出現(xiàn)了新的「識(shí)圖模式」選項(xiàng)，與「快速模式」和「專(zhuān)家模式」并列。這不是簡(jiǎn)單的 OCR 文字識(shí)別，而是真正的圖像理解。用戶(hù)可以上傳圖片，DeepSeek 能夠描述內(nèi)容、分析場(chǎng)景并回答關(guān)于圖片的問(wèn)題。這項(xiàng)功能目前還在逐步推送中。

DeepSeek 能夠識(shí)別文檔和圖片，但面對(duì)經(jīng)典的「數(shù)手指」問(wèn)題時(shí)未能準(zhǔn)確識(shí)別手指數(shù)量。這道題本身對(duì) AI 來(lái)說(shuō)有一定難度，GPT-5.5 和其他一些模型也未能成功識(shí)別。最新實(shí)測(cè)顯示，北美三大廠商中只有 Gemini 能夠準(zhǔn)確識(shí)別手指數(shù)量。

LiveBench 榜單顯示，V4-Pro 得分為 73.58 分，在全榜排名第 11 位。前 10 名均為閉源模型，包括 GPT-5.5 Thinking xHigh 80.71、GPT-5.4 Thinking xHigh 80.28 和 Gemini 3.1 Pro Preview 79.93 等。開(kāi)源模型中，V4-Pro 的得分最高，比榜首的 GPT-5.5 低 7 分。具體來(lái)看，V4-Pro 在數(shù)學(xué)和推理方面表現(xiàn)較強(qiáng)，分別得分為 90.68 和 82.69，編程方面較弱，得分為 69.99。語(yǔ)言理解得分為 78.13，表現(xiàn)尚可。

其他國(guó)產(chǎn)模型如 Kimi K2.6 Thinking 得分為 72.17，Qwen 3.6 Plus 得分為 70.85，GLM 5.1 得分為 70.18，DeepSeek-V4-Flash 得分為 67.25。

V4-Pro 的 2.5 折限時(shí)折扣延長(zhǎng)至 5 月 31 日 23:59。在這期間，V4-Pro API 緩存命中費(fèi)用為 0.025 元/百萬(wàn) tokens，輸入費(fèi)用為 3 元，輸出費(fèi)用為 6 元。建議調(diào)用時(shí)開(kāi)啟 1M 上下文（在模型 ID 后加上 [1m]），并將推理強(qiáng)度設(shè)置為 max，以獲得最佳性能。

(責(zé)任編輯：zx0001)

關(guān)閉

Claude畫(huà)的DeepSeek藍(lán)胖魚(yú) 多模態(tài)識(shí)圖新功能上線

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)