龍蝦之父推薦了兩款國產(chǎn)模型 PinchBench榜單引關(guān)注

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2026-03-10 08:50:16 量子位

龍蝦之父推薦了兩款國產(chǎn)模型 PinchBench榜單引關(guān)注。龍蝦太火，所有人都想一試。但真到了上手環(huán)節(jié)就會遇到難題——究竟哪個模型最適合OpenClaw呢？別急，龍蝦之父推薦了一個有趣的榜單：PinchBench。這個榜單專為龍蝦而設，從成功率、速度、價格等維度評估全球大模型對OpenClaw的適配程度，并且實時更新。

今年2月底，PinchBench就已經(jīng)出現(xiàn)，現(xiàn)在更受歡迎了。這不僅因為有龍蝦之父的推薦，更重要的是中國模型的表現(xiàn)確實出色。前排國產(chǎn)模型在榜單中的表現(xiàn)非常搶眼。

熟悉龍蝦的人都知道，選擇合適的模型非常重要。一方面，龍蝦消耗token成本高；另一方面，速度也不能太慢，以免影響用戶體驗。因此，人們在價格和速度之間艱難權(quán)衡。PinchBench則直接告訴你答案，按照成功率、速度、價格這三個基本維度對全球模型進行排名，使得哪個模型更擅長什么一目了然。

截至發(fā)稿前，榜單具體情況如下：整體而言，中國模型在成功率和速度方面表現(xiàn)出色，但在價格方面稍遜一籌。比成功率，除了第一名谷歌Gemini 3 Flash，第二、第三名都出自國內(nèi)。具體排名如下： - 第一名（Gemini 3 Flash）：成功率95.1% - 第二名（MiniMax M2.1）：成功率93.6% - 第三名（Kimi K2.5）：成功率93.4%

值得注意的是，MiniMax用的還不是它家最新模型MiniMax M2.5。比速度，國產(chǎn)模型MiniMax M2.5更是超越了Gemini、Llama等模型，登上榜首。MiniMax M2.5在SWE-Bench Verified測試中，完成任務的速度較上一代M2.1提升了37%，端到端運行時間縮短至22.8分鐘，與Claude Opus 4.6持平。然而，在價格方面，國產(chǎn)模型與OpenAI、谷歌模型相比缺乏優(yōu)勢。例如，GPT-5-nano輸入價格低至0.05美元/百萬tokens，輸出價格低至0.40美元/百萬tokens，而國產(chǎn)模型中最便宜的MiniMax M2.1，輸入價格為2.1元/百萬tokens（約0.3美元/百萬tokens），輸出價格為8.4元/百萬tokens（約1.2美元/百萬tokens），平均下來幾乎是前者的3倍。

12 全文共 2 頁下一頁

關(guān)閉

龍蝦之父推薦了兩款國產(chǎn)模型 PinchBench榜單引關(guān)注

相關(guān)新聞

今日熱點

頻道熱點