大模型明星企業(yè)DeepSeek在深夜發(fā)布了新版本。5月29日凌晨,DeepSeek開源了R1最新0528版本,但沒有對該版本進行任何說明,只是悄然開放了模型。預(yù)計很快會有更多關(guān)于該模型的介紹。已有網(wǎng)友迫不及待地對新版R1進行了測試,在著名代碼測試平臺Live CodeBench中顯示,其性能可以媲美OpenAI最新的o3模型高版本。此外,有網(wǎng)友對新版R1的風(fēng)格進行了測試,發(fā)現(xiàn)其風(fēng)格幾乎和OpenAI的o3相似。
此前,DeepSeek在官方交流群中發(fā)布通知,宣布DeepSeek R1模型已完成小版本試升級,并邀請用戶前往官方網(wǎng)頁、App和小程序進行測試。API接口和使用方式保持不變。今年3月,DeepSeek也曾通過官方交流群宣布V3模型的小版本升級,并隨后公布了具體更新內(nèi)容。3月25日晚,DeepSeek在其官方賬號上正式宣布V3模型完成小版本升級的消息,介紹了新版本DeepSeek-V3-0324模型在推理、前端開發(fā)、中文寫作等方面的能力優(yōu)化。當(dāng)時,據(jù)海外專業(yè)AI模型評測機構(gòu)的排名,新版V3模型是得分最高的非推理模型,超過xAI的Grok3和OpenAI的GPT-4.5(preview)。
關(guān)于此次最新升級的R1模型,用戶反饋顯示,思維鏈 (CoT) 的行為似乎發(fā)生了顯著變化。一些用戶總結(jié)了更新后的幾個亮點,包括像Google模型一樣進行深度推理、改進寫作任務(wù)——更自然且格式更好、獨特的推理風(fēng)格——不僅快速而且深思熟慮、長時間思考——每個任務(wù)最多30到60分鐘。
今年1月,DeepSeek正式發(fā)布了高性能開源推理大語言模型R1。該模型在數(shù)學(xué)推理、編程、邏輯分析等領(lǐng)域表現(xiàn)優(yōu)異,以極低成本實現(xiàn)了對OpenAI o1等閉源模型的性能對標(biāo),迅速成為全球AI領(lǐng)域的焦點。相比此次小版本升級的R1大模型,外界更期待DeepSeek推出R2模型。此前有關(guān)R2大模型的傳聞不斷,如參數(shù)規(guī)模可能達到驚人的1.2萬億,比前代R1的6710億參數(shù)幾乎翻倍,但目前尚未獲得官方證實。
3月20日午間,DeepSeek服務(wù)狀態(tài)頁面顯示,DeepSeek R1網(wǎng)頁/API不可用。隨后,DeepSeek更新狀態(tài)顯示,問題已被解決
2025-03-21 13:27:16DeepSeekR1服務(wù)恢復(fù)正常每經(jīng)AI快訊,2月28日,DeepSeek開源周第五天,DeepSeek在官方X賬號宣布開源3FS,它是所有Deepseek數(shù)據(jù)訪問的助推器
2025-02-28 11:52:14DeepSeek開源周第五天