幾乎是一夜之間,“來自東方的神秘力量”再次震撼了海外人士。1月27日,由國產(chǎn)大模型公司杭州深度求索開發(fā)的Deepseek應用登頂蘋果中國地區(qū)和美國地區(qū)應用商店免費APP下載排行榜,在美區(qū)下載榜上超越了ChatGPT。
據(jù)界面新聞報道,1月27日,DeepSeek官網(wǎng)顯示網(wǎng)頁/API不可用。前一天(26日),DeepSeek曾出現(xiàn)短時閃崩現(xiàn)象。對此,DeepSeek回應稱,當天下午確實出現(xiàn)了局部服務波動,但問題在數(shù)分鐘內(nèi)得到解決。此次事件可能是由于新模型發(fā)布后用戶訪問量激增,服務器一時無法滿足大量用戶的并發(fā)需求。
Deepseek來自量化巨頭幻方量化旗下的大模型公司。1月20日,該公司正式發(fā)布推理大模型DeepSeek-R1。一經(jīng)推出,這款模型便憑借其“物美價廉”的特性在海外開發(fā)者社區(qū)中引發(fā)轟動。今年1月20日,國務院總理李強主持召開專家、企業(yè)家和教科文衛(wèi)體等領域代表座談會,聽取對《政府工作報告(征求意見稿)》的意見建議。DeepSeek創(chuàng)始人梁文鋒參加了此次座談會。
在校期間,梁文鋒對金融市場產(chǎn)生了濃厚興趣。特別是在2008年全球金融危機期間,他帶領團隊探索了機器學習技術在全自動量化交易中的應用潛力,為日后職業(yè)生涯奠定了基礎。畢業(yè)后,梁文鋒將目光轉(zhuǎn)向更廣闊的金融市場。2013年,他與浙大同學徐進共同創(chuàng)立了杭州雅克比投資管理有限公司,兩年后又成立了杭州幻方科技有限公司,致力于通過數(shù)學和人工智能進行量化投資。2015年的市場波動中,幻方依靠先進的高頻量化策略取得了顯著成績。
2016年,幻方推出了首個基于深度學習的交易模型,并實現(xiàn)了所有量化策略的AI化轉(zhuǎn)型。2018年,幻方確立了以AI為核心的發(fā)展戰(zhàn)略。然而,隨著業(yè)務快速擴展,算力瓶頸逐漸顯現(xiàn)。為解決計算資源不足的問題,2019年,梁文鋒帶領團隊自主研發(fā)了“螢火一號”訓練平臺,總投資近2億元,搭載了1100塊GPU。兩年后,“螢火二號”的投入增加到10億元,搭載了約1萬張英偉達A100顯卡。
最近,DeepSeek在國內(nèi)外引起廣泛關注,其創(chuàng)始人梁文鋒也成為了焦點人物。梁文鋒來自廣東省湛江市吳川市,今年春節(jié)他回到了老家過年
2025-01-31 08:17:17DeepSeek創(chuàng)始人家鄉(xiāng)拉橫幅歡迎游客