剛剛，全球首個混合推理模型Claude 3.7降世！

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-02-25 12:44:53 新智元

全球首個混合推理模型Claude 3.7降世！Anthropic終于發(fā)布了其首款混合推理模型Claude 3.7 Sonnet，這是迄今為止最智能的Claude系列模型。它能夠及時響應(yīng)，并進(jìn)行可擴(kuò)展的逐步思考。簡單來說，這個模型具備兩種思考方式。

例如，用戶可以將一個復(fù)雜的數(shù)學(xué)問題如蒙提霍爾問題交給Claude 3.7 Sonnet，并選擇“擴(kuò)展”模式。在這種模式下，Claude 3.7 Sonnet會展示詳細(xì)的思維過程，并在52秒內(nèi)完成解答。目前，所有人都可以免費(fèi)使用Claude 3.7 Sonnet，但“擴(kuò)展思考”模式尚未上線。

在多項(xiàng)基準(zhǔn)測試中，Claude 3.7 Sonnet在數(shù)學(xué)、物理、指令執(zhí)行和編程等方面刷新了SOTA記錄。與上一代Claude 3.5相比，其數(shù)學(xué)和編碼能力提升了10%以上。除了數(shù)學(xué)領(lǐng)域，Claude 3.7 Sonnet（64k擴(kuò)展思考）幾乎完全碾壓o3-mini和DeepSeek R1，在某些方面甚至與Grok 3不相上下。API用戶可以精確控制模型的思考時間，使其成為一個強(qiáng)大的軟件工程AI，在SWE-bench上創(chuàng)下了70.3%的高分。

與此同時，Anthropic還推出了首款智能體編程工具Claude Code（預(yù)覽版）。該工具已成為Anthropic內(nèi)部不可或缺的一部分，在早期測試中，Claude一次性完成了通常需要45分鐘的任務(wù)。這意味著產(chǎn)品經(jīng)理可以利用AI來編寫代碼。

雖然沒有發(fā)布Claude 4，但Anthropic這一舉動再次震撼了AI界。最近半個月，Grok 3剛剛發(fā)布，DeepSeek連續(xù)開源五天，OpenAI GPT-4.5也即將上線，再加上Claude 3.7 Sonnet，大模型領(lǐng)域的競爭愈發(fā)激烈。

Claude 3.7 Sonnet是市場上首個混合推理模型，能夠即時響應(yīng)或逐步展示詳細(xì)的思考步驟。API用戶還可以精細(xì)控制模型的思考時間。在編碼和前端網(wǎng)頁開發(fā)方面，Claude 3.7 Sonnet得到了顯著提升。此外，Claude Code作為命令行工具，使開發(fā)人員能夠直接從終端將大量工程任務(wù)委托給Claude。

12 全文共 2 頁下一頁

關(guān)閉

剛剛，全球首個混合推理模型Claude 3.7降世！

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

剛剛，全球首個混合推理模型Claude 3.7降世！