讓大模型在長上下文中兼具高效與高保真度。
DeepSeek團隊新論文,圖/X
這不是DeepSeek第一次發(fā)布技術論文,第一次為業(yè)界提供一種難題的解決思路。但更重要的其實是不同于o1模型,DeepSeek此前用R1徹底揭開了OpenAI無論如何都想藏起來的——推理類模型「算法的秘密」,給更多人、更多廠商復制和超越o1的可能。
過去,大模型行業(yè)默認接受了封閉模式——從GPT-3之后,AI技術的進步被歸結為「資源游戲」,更大的算力、更貴的數(shù)據(jù)、更封閉的API,塑造了AI的商業(yè)邏輯。
這種邏輯一度被認為是不可逆的,畢竟 AI 訓練的成本極高,封閉系統(tǒng)能確保收益最大化,同時維持技術優(yōu)勢。但 DeepSeek R1 徹底改變了這種假設。
圖/DeepSeek
相比更早之前發(fā)布的 OpenAI o1、Kimi k1,DeepSeek R1 不僅是作為開源模型,而是一種全新的思維方式——它讓 AI 的「思考過程」成為透明的,讓所有開發(fā)者都能看到推理是如何發(fā)生的。
更重要的是,它證明了AI進步不必依賴「算力堆疊」,DeepSeek另辟蹊徑,通過推理優(yōu)化,而不是純粹地算力擴展,重新定義AI進步的路徑。
這種開源路徑帶來的變化,不只是技術上的,也是生態(tài)上的。
在封閉體系下,企業(yè)只能被動接受 OpenAI、Anthropic 這樣的巨頭定價,而 DeepSeek R1 讓企業(yè)有了更低的成本、更靈活的選擇,所有過去被封閉 AI 掌控的能力,如今都可以在開源環(huán)境中自由演進。
這不僅提高了AI的普及度,也讓整個行業(yè)面臨的壁壘大幅削減,這也是為什么我們會看到,所有廠商似乎都在接入DeepSeek。當然,出于營銷目的的接入以及簡單粗暴的接入方式,也是這種變化中不可避免的一個過程。
1月15日,MiniMax發(fā)布了新一代01系列模型,并將其開源。該系列包括基礎語言大模型MiniMax-Text-01和視覺多模態(tài)大模型MiniMax-VL-01
2025-01-15 16:15:38MiniMax發(fā)布新一代開源模型微信最近推出了一項重要更新,上線了“AI搜索”功能,并開始灰度測試DeepSeek-R1模型提供的“深度思考”服務
2025-02-17 07:50:40MaaS模型即服務將要被顛覆了嗎