DeepSeek撼動(dòng)AI生態(tài)游戲規(guī)則!今年春節(jié),一款名為DeepSeek R1的中國(guó)大模型在全球AI圈引起了廣泛關(guān)注。這款模型直接對(duì)標(biāo)了OpenAI去年9月發(fā)布的OpenAI o1系列模型。1月27日,DeepSeek在中國(guó)區(qū)和美國(guó)區(qū)蘋果App Store免費(fèi)榜上同時(shí)沖到了下載量第一,單周下載量高達(dá)約240萬(wàn)次。
在DeepSeek R1發(fā)布之前,OpenAI o1一直是中國(guó)大模型廠商難以企及的目標(biāo)。然而,DeepSeek R1的出現(xiàn)改變了這一局面。OpenAI CEO奧特曼表示,這是一個(gè)令人印象深刻的模型,英偉達(dá)也稱贊其為最先進(jìn)的大語(yǔ)言模型。與OpenAI的閉源策略不同,DeepSeek R1不僅開源,還免費(fèi)供全球用戶無(wú)限調(diào)用。
這場(chǎng)由DeepSeek引發(fā)的AI風(fēng)暴,也引起了一些恐慌和攻擊。Meta內(nèi)部員工透露,生成式人工智能部門陷入恐慌;OpenAI則在兩周內(nèi)接連發(fā)布了三個(gè)大模型:兩個(gè)AI智能體Operator、Deep Research以及推理模型o3-mini。此外,1月28日凌晨,DeepSeek官網(wǎng)連續(xù)發(fā)布公告稱,線上服務(wù)受到大規(guī)模惡意攻擊。
值得注意的是,DeepSeek打破了大模型行業(yè)拼算力的共識(shí),僅用了不到OpenAI十分之一的資源就做出了性能對(duì)標(biāo)OpenAI o1的DeepSeek R1。這引發(fā)了人們對(duì)AI上下游產(chǎn)業(yè)的重新思考。截至1月27日美股收盤,美股科技股大跌,費(fèi)城半導(dǎo)體指數(shù)下跌9.2%,英偉達(dá)股價(jià)下跌近17%。
2023年春節(jié),ChatGPT的出現(xiàn)點(diǎn)燃了AI行業(yè)的火種。自那之后,每年春節(jié)都有爆火的大模型出現(xiàn)。2024年是Sora,2025年則是DeepSeek。今年,站在C位的是中國(guó)的深度求索。DeepSeek上線20天,日活突破2000萬(wàn),徹底沖擊了AI行業(yè)。
實(shí)際上,相比OpenAI和其他公司動(dòng)輒數(shù)億美元的訓(xùn)練成本,DeepSeek始終走的是“花小錢,辦大事”的路線。早在去年12月底,DeepSeek發(fā)布的V3模型僅使用2048塊英偉達(dá)H800芯片,耗費(fèi)約560萬(wàn)美元。相比之下,GPT-4o使用上萬(wàn)塊英偉達(dá)H100芯片,訓(xùn)練成本約1億美元。
無(wú)論是價(jià)格還是訓(xùn)練成本,DeepSeek都追求細(xì)分和創(chuàng)新。例如,通過一種新的MLA架構(gòu)和數(shù)據(jù)蒸餾技術(shù),降低了顯存占用并減少了訓(xùn)練數(shù)據(jù)量。DeepSeek R1的強(qiáng)大推理能力得益于強(qiáng)化學(xué)習(xí)方法,無(wú)需任何監(jiān)督式微調(diào)。
DeepSeek的成功不僅在于技術(shù)創(chuàng)新,還在于其開源理念。DeepSeek R1的預(yù)訓(xùn)練成本僅為557.6萬(wàn)美元,遠(yuǎn)低于GPT-4o的水平。此外,DeepSeek API服務(wù)定價(jià)也遠(yuǎn)低于OpenAI。這些變化讓市場(chǎng)開始質(zhì)疑,是否真的需要那么多算力來(lái)訓(xùn)練高性能的大模型。
DeepSeek的崛起打破了原有的平衡,對(duì)傳統(tǒng)AI巨頭構(gòu)成了挑戰(zhàn)。OpenAI迅速做出調(diào)整,發(fā)布了o3-mini等新模型,并降低了API調(diào)用價(jià)格。與此同時(shí),DeepSeek也面臨一些爭(zhēng)議,包括被指控未經(jīng)授權(quán)竊取數(shù)據(jù)以及遭受網(wǎng)絡(luò)攻擊。不過,許多企業(yè)如華為云、騰訊云、阿里云等紛紛宣布支持DeepSeek大模型。
這場(chǎng)由DeepSeek掀起的新風(fēng)暴仍在繼續(xù),未來(lái)AI行業(yè)的走向充滿變數(shù)。
2月26日,在開源周第三天,DeepSeek宣布開放高效的FP8 GEMM庫(kù)DeepGEMM。這三天的發(fā)布內(nèi)容都與算法相關(guān),偏向技術(shù)層面
2025-02-26 21:35:35DeepSeek開源第三日行業(yè)影響幾何在DeepSeek極低成本的推動(dòng)下,開源模型和閉源模型之間的差距顯著縮小,掀起了一輪國(guó)產(chǎn)AI芯片廠商競(jìng)相適配的風(fēng)潮
2025-02-15 18:37:10DeepSeek訓(xùn)練仍基于英偉達(dá)CUDA生態(tài)