DeepSeek引發(fā)的蝴蝶效應(yīng)仍在持續(xù)。1月20日,DeepSeek公司發(fā)布了其推理模型DeepSeek-R1的完整版本。該模型通過算法優(yōu)化,以較低的訓(xùn)練成本實(shí)現(xiàn)了與OpenAI的o1模型相媲美的性能,并且開源。
傳統(tǒng)AI訓(xùn)練對算力的需求巨大,而DeepSeek開辟了一條新路徑,吸引了眾多企業(yè)爭相接入。據(jù)統(tǒng)計(jì),已有超過100家國內(nèi)上市公司接入了DeepSeek-R1模型,其中包括阿里、騰訊、百度和三大運(yùn)營商等擁有自研模型和AI應(yīng)用的企業(yè)。
業(yè)內(nèi)人士指出,企業(yè)選擇DeepSeek的原因主要有兩點(diǎn):一是DeepSeek-R1開源徹底,部署方便,在特定場景下表現(xiàn)出強(qiáng)大的處理和推理能力;二是DeepSeek聲量走高,意味著接入方有機(jī)會承接其外溢的流量。數(shù)據(jù)顯示,DeepSeek的日活躍用戶數(shù)在2月1日突破3000萬大關(guān)。
然而,接入DeepSeek模型也可能面臨巨大的虧損壓力。據(jù)潞晨科技CEO尤洋測算,如果每日輸出1000億token,一個(gè)月算下來接入方企業(yè)可獲得4800萬元收入,但完成這一輸出需要約4000臺搭載H800的機(jī)器,每月僅機(jī)器成本就達(dá)4.5億元,因此企業(yè)可能面臨每月4億元的虧損。另一名市場負(fù)責(zé)人表示,目前公司對外合作項(xiàng)目還未落地,具體成本數(shù)據(jù)暫不清晰。
在AI的潮汐效應(yīng)下,接入DeepSeek是否一本萬利,還需進(jìn)一步觀察。
企業(yè)接入DeepSeek的程度有所不同。例如,騰訊近乎全面擁抱DeepSeek,將微信、騰訊文檔、QQ瀏覽器等業(yè)務(wù)側(cè)產(chǎn)品先后接入DeepSeek-R1,并推出支持混元大模型和DeepSeek-R1切換使用的“騰訊元寶”。相比之下,阿里等公司在主營業(yè)務(wù)側(cè)產(chǎn)品上接入了DeepSeek,但仍保留了自研大模型產(chǎn)品的空間。
值得買科技CTO王云峰認(rèn)為,接入模型并非數(shù)量上的比拼,需求方應(yīng)充分考慮模型與業(yè)務(wù)場景的適配性。他提到,值得買科技自研了130億參數(shù)消費(fèi)大模型,也接入了一些主流模型。DeepSeek-R1在生成內(nèi)容的行文邏輯和文學(xué)性方面表現(xiàn)突出,提升了公司內(nèi)容生產(chǎn)的效率。
網(wǎng)絡(luò)安全公司知道創(chuàng)宇是DeepSeek早期的受益者之一。去年12月,知道創(chuàng)宇旗下的網(wǎng)絡(luò)空間測繪引擎ZoomEye國際版上線了對DeepSeek的支持。該公司CSO周景平表示,從接入DeepSeek到現(xiàn)在,平臺注冊量增長28.5%,活躍度增長121.6%,AI搜索功能使用率達(dá)35.8%。DeepSeek被應(yīng)用于漏洞挖掘、數(shù)據(jù)情報(bào)分析、規(guī)則轉(zhuǎn)化處理等多個(gè)細(xì)分業(yè)務(wù)場景中。
企業(yè)扎堆接入DeepSeek也忙壞了位于大模型產(chǎn)業(yè)鏈中間層的適配廠商。一家AI Infra廠商的市場負(fù)責(zé)人表示,DeepSeek爆火后,咨詢者日益增多,工作節(jié)奏明顯加快。另一位創(chuàng)始人趙欣稱,需求大漲,行業(yè)工作節(jié)奏普遍加快,產(chǎn)品走向市場并為人所用,也是個(gè)人價(jià)值層面的正向反饋。
對于企業(yè)接入DeepSeek的成本,硬件和部署成本是主要部分。不同規(guī)格的硬件價(jià)格差異較大,具體成本取決于企業(yè)的具體要求。有些中小型企業(yè)會選擇蒸餾版的模型或直接調(diào)用云廠商的API,以降低適配成本。目前來看,客戶企業(yè)一般都具備承擔(dān)該項(xiàng)成本的能力。