DeepSeek梁文鋒的第一桶金。春節(jié)期間,國(guó)產(chǎn)AI獨(dú)角獸DeepSeek意外走紅,其創(chuàng)始人梁文鋒的家鄉(xiāng)廣東湛江吳川覃巴鎮(zhèn)米歷嶺村吸引了眾多游客前來“打卡”。甚至有建筑風(fēng)水師拿著羅盤研究起村莊和梁文鋒家宅的布局,科技與玄學(xué)在此巧妙結(jié)合。
在國(guó)內(nèi)大廠和國(guó)際巨頭紛紛押注AI大模型的背景下,由量化私募公司幻方孵化的DeepSeek憑借“能用、好用、用得起”的口碑悄然滲透市場(chǎng)。盡管團(tuán)隊(duì)核心成員僅百余人且沒有大規(guī)模發(fā)布會(huì),但其崛起不僅引發(fā)美國(guó)科技股大幅下跌,還迫使行業(yè)掀起價(jià)格戰(zhàn)。梁文鋒本人因豪捐上億善款及拒絕資本裹挾的姿態(tài),成為中國(guó)AI領(lǐng)域的一股清流。
DeepSeek的春節(jié)走紅充滿草根性。一方面,技術(shù)下沉讓縣城中學(xué)可以用老舊機(jī)房開展AI教學(xué),縣城程序員也能調(diào)試代碼。開源的數(shù)學(xué)推理模型被中小科技公司接入業(yè)務(wù)系統(tǒng)。另一方面,極致性價(jià)比使得API調(diào)用價(jià)格低至0.14元/萬token,僅為行業(yè)均價(jià)的1/20。河南某農(nóng)產(chǎn)品電商借此將智能客服成本壓縮92%。
支撐這種性價(jià)比的是幻方從量化交易中提煉出的技術(shù)哲學(xué)——自研“動(dòng)態(tài)計(jì)算圖”技術(shù)使同一批GPU可并行訓(xùn)練3個(gè)模型,硬件利用率達(dá)89%,遠(yuǎn)高于行業(yè)平均水平。訓(xùn)練數(shù)據(jù)清洗引入量化風(fēng)控模型,將無效數(shù)據(jù)標(biāo)記率提升至93%,百億參數(shù)模型訓(xùn)練成本控制在800萬元內(nèi)。不同于大廠追求萬億參數(shù)競(jìng)賽,DeepSeek專注提升單位算力產(chǎn)出效率。其13B參數(shù)模型在法律文書審核場(chǎng)景擊敗多家千億級(jí)大模型,這得益于幻方團(tuán)隊(duì)多年處理金融法律文本的經(jīng)驗(yàn)遷移。
梁文鋒堅(jiān)持用量化交易的資金支持AI研發(fā)。他表示,作為出資人的幻方有充足的研發(fā)預(yù)算,并每年有幾個(gè)億的捐款預(yù)算,如有需要可以調(diào)整。此外,分析指出,幻方將每年凈利潤(rùn)的90%投入技術(shù)攻堅(jiān),團(tuán)隊(duì)成員自愿將年終獎(jiǎng)轉(zhuǎn)為研發(fā)基金。然而,2023年A股波動(dòng)導(dǎo)致幻方研發(fā)資金同比減少18%,不得不暫停兩個(gè)長(zhǎng)期項(xiàng)目。
在科技領(lǐng)域風(fēng)起云涌的今天,一家名為DeepSeek的AI公司突然成為了全球關(guān)注的焦點(diǎn)
2025-02-11 14:32:25DeepSeek梁文鋒身家暴漲