不只是百度大模型在調(diào)整到“開源與免費(fèi)”的姿態(tài)。
2月初,OpenAI CEO Sam Altman 罕見承認(rèn) OpenAI 的閉源策略站在了「錯(cuò)誤的一邊」,同時(shí)小心翼翼地放出了有限度「免費(fèi)+開源」的消息。
現(xiàn)在更進(jìn)一步了,2 月 18 日,OpenAI CEO Sam Altman 在 X 平臺(tái)(原 Twitter)上詢問網(wǎng)友:
「對(duì)于我們的下一個(gè)開源項(xiàng)目,是做一個(gè)相當(dāng)小巧但仍然需要在GPU上運(yùn)行的o3-mini級(jí)別模型更有用,還是做我們能做的最好的手機(jī)尺寸模型?」
也可能全都要,在手機(jī)上運(yùn)行o3mini水平模型,圖/X
毫無疑問,結(jié)合之前 OpenAI 在 DeepSeek 沖擊下放出的一系列消息,Sam Altman 不僅官宣了「開源項(xiàng)目」,也是在暗示 OpenAI 開源計(jì)劃的兩個(gè)方向。而在過去六年,OpenAI 一直堅(jiān)守封閉策略(甚至因此被網(wǎng)友稱為CloseAI),自 GPT-2 之后再未開源任何大模型。
背后DeepSeek帶來的壓力顯而易見。
ChatGPT 問世后,OpenAI 在閉源模型的基礎(chǔ)上通過「API+訂閱制」構(gòu)建起強(qiáng)大的商業(yè)護(hù)城河,但 DeepSeek V3 和 R1 證明了開源大模型同樣可以媲美 GPT-4o 級(jí)別的能力,并且成本更低、可本地部署。
面對(duì)這一挑戰(zhàn),OpenAI再也無法對(duì)開源陣營(yíng)置之不理。過去,企業(yè)幾乎只能依賴OpenAI或Google等大模型廠商提供的封閉API,而現(xiàn)在,越來越多公司開始直接從云計(jì)算平臺(tái)或者部署DeepSeek等開源大模型,大幅降低AI計(jì)算成本。
也不僅僅是OpenAI,整個(gè)AI生態(tài)都在擁抱開源,甚至一向推崇閉源的百度也宣布下一代文心大模型4.5系列將在6月底開源。
而僅在2月18日一天,就有多個(gè)模型宣告開源:
-昆侖萬維宣布,開源中國首個(gè)面向AI短劇創(chuàng)作的視頻生成模型SkyReels-V1,以及基于視頻基座模型的表情動(dòng)作可控算法SkyReels-A1。
-階躍星辰和吉利汽車聯(lián)合宣布,將開源雙方合作的視頻生成模型階躍Step-Video-T2V和語音交互大模型階躍Step-Audio。
- 逐際動(dòng)力宣布,開源基于視頻生成大模型的具身操作算法(VideoGenMotion,簡(jiǎn)稱 LimX VGM)。
- 在剛剛發(fā)布 Grok 3 系列模型,馬斯克旗下 xAI 宣布,上一代大模型 Grok 2 將照例在幾個(gè)月后開源。
Grok 3 發(fā)布直播,圖/ xAI
在DeepSeek這只“鯰魚”的影響下,開源正在撬動(dòng)整個(gè)AI生態(tài),而一場(chǎng)AI產(chǎn)業(yè)的「開源革命」也已然開始。
就在短短幾個(gè)月前,關(guān)于AI的討論還集中在GPT(OpenAI)、Claude(Anthropic)和Gemini(Google)這樣的閉源模型上,而現(xiàn)在,DeepSeek幾乎以一舉之力扭轉(zhuǎn)了市場(chǎng)的注意力,將其迅速轉(zhuǎn)向開源陣營(yíng)。
除了之前就采用不同開源策略的Llama(Meta)、通義千問Qwen(阿里巴巴)以及Grok(xAI),開源陣營(yíng)也迎來了不同方向的大模型,
騰訊和字節(jié)就在早些時(shí)候開源了各自的視頻生成模型,也包括昆侖萬維剛剛開源的SkyReels-V1視頻模型。
不同于其他視頻模型追求的通用性,SkyReels-V1視頻可能是首個(gè)面向AI短劇生成的開源模型,性能上號(hào)稱是最強(qiáng)的圖生視頻開源模型。
圖/昆侖萬維
與此同時(shí),階躍星辰和吉利汽車開源了面向座艙場(chǎng)景的階躍 Step-Video-T2V 視頻生成模型,以及階躍 Step-Audio 語音交互大模型。另一邊是逐際動(dòng)力在視頻生成大模型打造了一套從文本到視頻,再到機(jī)器人運(yùn)動(dòng)和操作的算法 LimX VGM,并將之開源給所有機(jī)器人開發(fā)者。
這場(chǎng)AI競(jìng)賽,已經(jīng)遠(yuǎn)遠(yuǎn)超出了最初的語言模型之爭(zhēng),開源正以燎原之勢(shì),席卷整個(gè)AI生態(tài),也在一定程度上意味著大模型迭代的范式轉(zhuǎn)變。
最早,OpenAI以「開源」起家,GPT-2甚至還曾完全開放權(quán)重。但隨后OpenAI就徹底轉(zhuǎn)向閉源,并在基于GPT-3.5打造ChatGPT后迅速以API和訂閱制建立起商業(yè)模式。
OpenAI轉(zhuǎn)變的核心邏輯在于,訓(xùn)練大模型需要極高的算力成本,閉源可以確保盈利,避免開源導(dǎo)致的「免費(fèi)競(jìng)爭(zhēng)」。而通過API形式提供AI服務(wù),而不開放底層權(quán)重,防止競(jìng)品復(fù)制其技術(shù)。
圖/OpenAI
更重要的是,通過掌控用戶交互數(shù)據(jù),持續(xù)迭代GPT模型和ChatGPT,并維持市場(chǎng)領(lǐng)先地位。但OpenAI,終究還是忽略了開源的魔力以及最核心的技術(shù)創(chuàng)新。
如果回顧計(jì)算機(jī)技術(shù)史,實(shí)際上我們不難發(fā)現(xiàn),開源未必會(huì)在早期占據(jù)最有利的位置,但往往就像滾雪球一般:
越滾越大,最終勢(shì)不可擋。
2008年,Google決定對(duì)Android采取開源+商業(yè)化的策略,這一決定徹底改變了移動(dòng)操作系統(tǒng)格局。當(dāng)時(shí)的iOS是封閉的,而Android通過開源吸引了三星、華為以及小米等全球硬件廠商的支持,迅速超越iOS,成為全球市場(chǎng)占有率最高的移動(dòng)系統(tǒng)。
Chromium也是如此,盡管它最初只是一個(gè)開源瀏覽器引擎,但最終幾乎吞噬了整個(gè)瀏覽器市場(chǎng),就連微軟的Edge都不得不基于Chromium內(nèi)核重建。
今天AI領(lǐng)域在經(jīng)歷同樣的變革。
閉源AI依然能賺到錢,但隨著DeepSeek帶來的沖擊,市場(chǎng)已經(jīng)開始傾向于開源大模型的路線。一個(gè)核心在于,開源不僅降低了AI技術(shù)門檻,也給所有開發(fā)者和企業(yè)帶來了更多自由度——API接入、云端調(diào)用、本地部署,甚至是基于不同需求和數(shù)據(jù)進(jìn)行重新訓(xùn)練。
而這種自由,正是OpenAI體系下難以提供的。
還是 2 月 18 日,DeepSeek 在 X 平臺(tái)上發(fā)布了一篇技術(shù)論文,主要內(nèi)容是提出一種名為 NSA(Natively Sparse Attention,原生稀疏注意力)的新型注意力機(jī)制。核心是通過對(duì)硬件的友好與端到端訓(xùn)練,取得推理、訓(xùn)練速度和任務(wù)表現(xiàn)的綜合平衡:
讓大模型在長(zhǎng)上下文中兼具高效與高保真度。
DeepSeek團(tuán)隊(duì)新論文,圖/X
這不是DeepSeek第一次發(fā)布技術(shù)論文,第一次為業(yè)界提供一種難題的解決思路。但更重要的其實(shí)是不同于o1模型,DeepSeek此前用R1徹底揭開了OpenAI無論如何都想藏起來的——推理類模型「算法的秘密」,給更多人、更多廠商復(fù)制和超越o1的可能。
過去,大模型行業(yè)默認(rèn)接受了封閉模式——從GPT-3之后,AI技術(shù)的進(jìn)步被歸結(jié)為「資源游戲」,更大的算力、更貴的數(shù)據(jù)、更封閉的API,塑造了AI的商業(yè)邏輯。
這種邏輯一度被認(rèn)為是不可逆的,畢竟 AI 訓(xùn)練的成本極高,封閉系統(tǒng)能確保收益最大化,同時(shí)維持技術(shù)優(yōu)勢(shì)。但 DeepSeek R1 徹底改變了這種假設(shè)。
圖/DeepSeek
相比更早之前發(fā)布的 OpenAI o1、Kimi k1,DeepSeek R1 不僅是作為開源模型,而是一種全新的思維方式——它讓 AI 的「思考過程」成為透明的,讓所有開發(fā)者都能看到推理是如何發(fā)生的。
更重要的是,它證明了AI進(jìn)步不必依賴「算力堆疊」,DeepSeek另辟蹊徑,通過推理優(yōu)化,而不是純粹地算力擴(kuò)展,重新定義AI進(jìn)步的路徑。
這種開源路徑帶來的變化,不只是技術(shù)上的,也是生態(tài)上的。
在封閉體系下,企業(yè)只能被動(dòng)接受 OpenAI、Anthropic 這樣的巨頭定價(jià),而 DeepSeek R1 讓企業(yè)有了更低的成本、更靈活的選擇,所有過去被封閉 AI 掌控的能力,如今都可以在開源環(huán)境中自由演進(jìn)。
這不僅提高了AI的普及度,也讓整個(gè)行業(yè)面臨的壁壘大幅削減,這也是為什么我們會(huì)看到,所有廠商似乎都在接入DeepSeek。當(dāng)然,出于營(yíng)銷目的的接入以及簡(jiǎn)單粗暴的接入方式,也是這種變化中不可避免的一個(gè)過程。
就在 Sam Altman 詢問開源模型方向的推文下,有人依舊不滿于 OpenAI 的「開源策略」,并提出至少應(yīng)該開源 GPT-4——盡管由于成本和延遲早已不是主力,但依然是非推理類模型的一流性能水平。
R1已經(jīng)證明,不同于閉源的AI研究,開源的方式可以通過全球協(xié)作、技術(shù)共享,讓整個(gè)生態(tài)的進(jìn)步速度加快。未來的AI可能也不會(huì)是少數(shù)巨頭的壟斷,而是由大量參與者共同推進(jìn)的技術(shù)體系。
而 DeepSeek R1,正是這場(chǎng)「開源盛世」的開端。
從這個(gè)角度來看,DeepSeek和R1之所以重要,并不僅僅是它的性能,而是它所開啟的AI未來。開源不是封閉AI的備選方案,而是一條全新的康莊大道。
1月15日,MiniMax發(fā)布了新一代01系列模型,并將其開源。該系列包括基礎(chǔ)語言大模型MiniMax-Text-01和視覺多模態(tài)大模型MiniMax-VL-01
2025-01-15 16:15:38MiniMax發(fā)布新一代開源模型微信最近推出了一項(xiàng)重要更新,上線了“AI搜索”功能,并開始灰度測(cè)試DeepSeek-R1模型提供的“深度思考”服務(wù)
2025-02-17 07:50:40MaaS模型即服務(wù)將要被顛覆了嗎