DeepSeek梁文鋒的第一桶金。春節(jié)期間,國產(chǎn)AI獨(dú)角獸DeepSeek意外走紅,其創(chuàng)始人梁文鋒的家鄉(xiāng)廣東湛江吳川覃巴鎮(zhèn)米歷嶺村吸引了眾多游客前來“打卡”。甚至有建筑風(fēng)水師拿著羅盤研究起村莊和梁文鋒家宅的布局,科技與玄學(xué)在此巧妙結(jié)合。
在國內(nèi)大廠和國際巨頭紛紛押注AI大模型的背景下,由量化私募公司幻方孵化的DeepSeek憑借“能用、好用、用得起”的口碑悄然滲透市場。盡管團(tuán)隊核心成員僅百余人且沒有大規(guī)模發(fā)布會,但其崛起不僅引發(fā)美國科技股大幅下跌,還迫使行業(yè)掀起價格戰(zhàn)。梁文鋒本人因豪捐上億善款及拒絕資本裹挾的姿態(tài),成為中國AI領(lǐng)域的一股清流。
DeepSeek的春節(jié)走紅充滿草根性。一方面,技術(shù)下沉讓縣城中學(xué)可以用老舊機(jī)房開展AI教學(xué),縣城程序員也能調(diào)試代碼。開源的數(shù)學(xué)推理模型被中小科技公司接入業(yè)務(wù)系統(tǒng)。另一方面,極致性價比使得API調(diào)用價格低至0.14元/萬token,僅為行業(yè)均價的1/20。河南某農(nóng)產(chǎn)品電商借此將智能客服成本壓縮92%。
支撐這種性價比的是幻方從量化交易中提煉出的技術(shù)哲學(xué)——自研“動態(tài)計算圖”技術(shù)使同一批GPU可并行訓(xùn)練3個模型,硬件利用率達(dá)89%,遠(yuǎn)高于行業(yè)平均水平。訓(xùn)練數(shù)據(jù)清洗引入量化風(fēng)控模型,將無效數(shù)據(jù)標(biāo)記率提升至93%,百億參數(shù)模型訓(xùn)練成本控制在800萬元內(nèi)。不同于大廠追求萬億參數(shù)競賽,DeepSeek專注提升單位算力產(chǎn)出效率。其13B參數(shù)模型在法律文書審核場景擊敗多家千億級大模型,這得益于幻方團(tuán)隊多年處理金融法律文本的經(jīng)驗遷移。
梁文鋒堅持用量化交易的資金支持AI研發(fā)。他表示,作為出資人的幻方有充足的研發(fā)預(yù)算,并每年有幾個億的捐款預(yù)算,如有需要可以調(diào)整。此外,分析指出,幻方將每年凈利潤的90%投入技術(shù)攻堅,團(tuán)隊成員自愿將年終獎轉(zhuǎn)為研發(fā)基金。然而,2023年A股波動導(dǎo)致幻方研發(fā)資金同比減少18%,不得不暫停兩個長期項目。
幻方最初只是杭州一家低調(diào)的量化私募基金,團(tuán)隊不足20人,卻憑借AI算法在二級市場屢創(chuàng)收益神話。2015年A股波動中,梁文鋒團(tuán)隊逆勢斬獲300%年化收益,迅速積累數(shù)十億資本。到2022年,幻方管理規(guī)模突破千億,成為亞洲最大量化私募之一。同年,幻方和員工向慈善機(jī)構(gòu)捐贈共計約3.6億元。
梁文鋒多次公開表示:“幻方不需要融資,我們賺的錢足夠養(yǎng)活創(chuàng)新?!彪S后,他將量化領(lǐng)域的AI技術(shù)積累遷移到大模型賽道,成立DeepSeek,僅用3年時間便沖至全球大模型競技場第二梯隊,與谷歌、Meta等同臺競技。
相較于OpenAI數(shù)千人的團(tuán)隊和百億美元投入,DeepSeek核心團(tuán)隊僅百余人,研發(fā)成本不足行業(yè)巨頭的1/10。其開源模型DeepSeek-Math在GSM8K數(shù)學(xué)推理測試中超越GPT-4,而API價格僅為GPT-4的1/50。這種“極致性價比”直接沖擊市場,倒逼阿里、百度等大廠降價應(yīng)戰(zhàn)。
DeepSeek崛起背后是近乎瘋狂的技術(shù)投入。曾被小米創(chuàng)始人雷軍以千萬年薪招攬的開發(fā)者羅福莉直言,在幻方,技術(shù)理想比商業(yè)回報更有吸引力。
DeepSeek的崛起也反映了國產(chǎn)芯片行業(yè)的當(dāng)前困局。梁文鋒認(rèn)為中國AI芯片的問題在于生態(tài)而非制程。為了規(guī)避英偉達(dá)限制,DeepSeek使用華為昇騰910B訓(xùn)練模型,但算子兼容性問題導(dǎo)致訓(xùn)練效率降低40%,團(tuán)隊不得不用30%工程師人力開發(fā)轉(zhuǎn)換工具。
當(dāng)多數(shù)公司焦慮何時做出中國版GPT-4時,幻方用數(shù)學(xué)思維重新定義競爭維度——不做參數(shù)規(guī)模的奴隸,而是深耕“輸入1度電,產(chǎn)出10倍智能”。當(dāng)行業(yè)沉迷資本故事時,幻方證明,用量化交易的“快錢”支撐硬核科技的“慢研發(fā)”,并非天方夜譚。當(dāng)全球追逐通用人工智能(AGI)圣杯時,中國或許更需要1000個深度改造制造業(yè)、農(nóng)業(yè)、小微企業(yè)的“專用智能”。
春節(jié)假期結(jié)束第一天,DeepSeek社區(qū)出現(xiàn)一條高贊留言:“我們縣城程序員用你的模型接了三個訂單,養(yǎng)活了一個五人小團(tuán)隊?!边@或許才是中國AI最真實的生命力——不在融資新聞的頭條里,而在無數(shù)普通人用技術(shù)改善生活的細(xì)節(jié)中。
在全球AI陷入千億美金“軍備競賽”時,梁文鋒與幻方提供了一種反主流敘事——用數(shù)學(xué)家的極致理性、工程師的務(wù)實創(chuàng)新以及近乎偏執(zhí)的成本控制,證明“聰明資本”與“技術(shù)理想主義”可以共存。這或許正是中國AI破局的關(guān)鍵密碼:不需要另一個OpenAI,而是需要100個DeepSeek。冷峻又務(wù)實,或為國產(chǎn)AI的未來。
在科技領(lǐng)域風(fēng)起云涌的今天,一家名為DeepSeek的AI公司突然成為了全球關(guān)注的焦點(diǎn)
2025-02-11 14:32:25DeepSeek梁文鋒身家暴漲