DeepSeek服務(wù)再次出現(xiàn)“宕機(jī)”。1月27日11點(diǎn)左右,DeepSeek官網(wǎng)一度顯示網(wǎng)頁和API不可用,但功能隨后恢復(fù)。此前一天,DeepSeek也經(jīng)歷了一次短暫的服務(wù)波動(dòng),官方稱問題在數(shù)分鐘內(nèi)得到解決,可能與新模型發(fā)布后的訪問量激增有關(guān)。1月27日早間,DeepSeek應(yīng)用登頂蘋果中國地區(qū)和美國地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜,在美區(qū)超越了ChatGPT。1月24日,DeepSeek-R1在大模型排名中升至全類別第三,其中風(fēng)格控制類模型分類與OpenAI o1并列第一,競技場得分為1357分,略高于OpenAI o1的1352分。該模型每百萬個(gè)token的查詢成本僅為0.14美元,遠(yuǎn)低于OpenAI的7.50美元,并且允許開源。
DeepSeek的崛起讓華爾街算力板塊投資者感到不安。寒武紀(jì)一度大跌近10%,天孚通信、中際旭創(chuàng)、工業(yè)富聯(lián)、中興通訊等科技權(quán)重股也有不同程度下跌。英偉達(dá)美股夜盤跌超5%,博通跌超4%。納斯達(dá)克指數(shù)期貨跌超1.7%。軟銀集團(tuán)股價(jià)一度下跌近6%,藤倉大跌超8%,東京電子和Disco均跌超3%。
網(wǎng)絡(luò)社群中,越來越多的人將DeepSeek的出現(xiàn)與英偉達(dá)近期的回調(diào)聯(lián)系在一起。有美股大V表示,DeepSeek創(chuàng)造了一個(gè)AI巨頭們的痛苦時(shí)刻,投資者應(yīng)對此保持警惕。海外媒體和市場評(píng)論員也將其視為美國股市的一大威脅。
DeepSeek的開發(fā)者為杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月。該公司由寧波程恩企業(yè)管理咨詢合伙企業(yè)(有限合伙)和梁文鋒共同持股。梁文鋒是金融圈知名人士,創(chuàng)立了國內(nèi)量化私募巨頭幻方量化。他來自湛江市吳川市覃巴鎮(zhèn)米歷嶺村,父母均為小學(xué)語文老師。他在數(shù)學(xué)學(xué)科表現(xiàn)出極大天賦,初中時(shí)期就學(xué)完了高中數(shù)學(xué),甚至開始學(xué)習(xí)大學(xué)數(shù)學(xué)。
目前,梁文鋒持股寧波程恩50.1%,寧波程信柔兆企業(yè)管理咨詢合伙企業(yè)(有限合伙)持股49.8%,寧波程普商務(wù)咨詢有限公司持股0.1%。寧波程信由梁文鋒、鄭達(dá)韡、李歡、陳哲等自然人共同持股。
1月20日,深度求索正式發(fā)布DeepSeek-R1大模型,并同步開源模型權(quán)重。DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),提升了模型推理能力,在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上性能比肩OpenAI o1正式版。《黑神話:悟空》的主創(chuàng)馮驥高度評(píng)價(jià)DeepSeek,指出其強(qiáng)大、便宜、開源、免費(fèi)、聯(lián)網(wǎng)和支持本土開發(fā)六大優(yōu)點(diǎn)。
在美國硅谷,多位人工智能行業(yè)意見領(lǐng)袖對DeepSeek-R1表達(dá)贊賞。微軟CEO薩蒂亞·納德拉表示,他們開發(fā)出了一款開源模型,在推理計(jì)算方面表現(xiàn)出色。曾投資過OpenAI的投資人馬克·安德里森認(rèn)為,DeepSeek-R1是一項(xiàng)令人驚嘆的突破,并且是開源的,是對全世界的大禮。
DeepSeek-V3的研發(fā)費(fèi)用為558萬美元,訓(xùn)練成本不到GPT-4o的1/20,僅用了2048張H100的GPU集群,用時(shí)53天。相比之下,全球AI第一梯隊(duì)的頭部公司至少需要1.6萬張以上的GPU進(jìn)行訓(xùn)練。市場認(rèn)為,DeepSeek R1的成功可能削弱了市場對英偉達(dá)AI芯片需求的預(yù)期。
DeepSeek是一家低調(diào)的創(chuàng)業(yè)公司,注冊地位于杭州市拱墅區(qū)環(huán)城北路169號(hào)匯金國際大廈西1幢1201室。記者實(shí)地探訪發(fā)現(xiàn),該公司拒絕進(jìn)一步交流。加入的官方交流群公告顯示,暫不對外進(jìn)行項(xiàng)目合作,也不提供私有化部署及相關(guān)支持服務(wù)。
1月27日,DeepSeek概念股引爆A股,多只成分股高開或漲停。多家上市公司披露與DeepSeek的合作情況。昆侖萬維攜手新加坡南洋理工大學(xué)成功開發(fā)Q*算法,顯著提升現(xiàn)有大模型推理能力。每日互動(dòng)則接入多個(gè)國內(nèi)外通用大模型,結(jié)合自身數(shù)據(jù)積累和挖掘能力,開發(fā)垂直場景類大模型應(yīng)用。但也有一些公司表示未與DeepSeek合作。