中國一家人工智能實(shí)驗(yàn)室最近發(fā)布了一款尖端模型的技術(shù)細(xì)節(jié),此舉不僅震驚了世界,也讓其低調(diào)的負(fù)責(zé)人梁文鋒成為民族英雄。1月20日,由對沖基金經(jīng)理梁文鋒創(chuàng)立的公司深度求索正式發(fā)布了R1模型,并在一篇論文中詳細(xì)解釋了如何利用有限的自籌預(yù)算構(gòu)建一個(gè)大語言模型,該模型可在沒有人工監(jiān)督的情況下自動(dòng)學(xué)習(xí)和自我改善。
包括OpenAI和谷歌DeepMind在內(nèi)的美國企業(yè)率先開發(fā)出推理模型,這是一個(gè)相對較新的人工智能研究領(lǐng)域,旨在使模型具有與人類相匹配的認(rèn)知能力。上個(gè)月,OpenAI發(fā)布了o1模型的完整版本,但對其創(chuàng)建方法保密。深度求索R1模型的發(fā)布在硅谷引發(fā)了一場激烈辯論,討論資源更雄厚的美國人工智能企業(yè)能否守住技術(shù)優(yōu)勢。與此同時(shí),梁文鋒也成為提升中國國內(nèi)民族自豪感的焦點(diǎn)人物。本周,在中國總理召開的一次座談會中,梁文鋒是唯一的人工智能企業(yè)負(fù)責(zé)人。
2023年,梁文鋒創(chuàng)建了深度求索公司。另一家大語言模型公司的創(chuàng)始人表示,他建立了一個(gè)出色的基礎(chǔ)設(shè)施團(tuán)隊(duì),真正了解芯片的工作原理。在美國禁止英偉達(dá)向中國出口功能最強(qiáng)大的芯片后,中國本土人工智能企業(yè)被迫尋找創(chuàng)新方法,以最大限度地利用現(xiàn)有芯片的計(jì)算能力。深度求索的工程師已經(jīng)知道如何解決這一問題,能夠釋放這些圖形處理器(GPU)的潛力,即使它們不是最先進(jìn)的。
業(yè)內(nèi)人士認(rèn)為,深度求索對研究的專注使其成為一個(gè)可畏的競爭對手,因?yàn)樵摴驹敢夥窒砣〉玫耐黄?,而非為獲取商業(yè)利益保護(hù)它們。深度求索沒有從外部基金籌集資金,也沒有采取重大舉措將其模型貨幣化。北京的一名人工智能行業(yè)投資者表示,深度求索的運(yùn)作方式就像早期的DeepMind,專注于研究和工程。
深度求索僅用2048顆英偉達(dá)H800 GPU和560萬美元就訓(xùn)練出了6710億參數(shù)的開源大模型,這只是OpenAI和谷歌訓(xùn)練同等類型模型花費(fèi)的一小部分。加州大學(xué)伯克利分校的人工智能政策研究員里特維克·古普塔表示,深度求索最近發(fā)布的模型表明,沒有阻礙人們獲取人工智能能力的障礙。他說,訓(xùn)練模型的第一人必須花費(fèi)大量資源才能實(shí)現(xiàn)目的,但跟進(jìn)者可以用更少的費(fèi)用且更快的速度實(shí)現(xiàn)目標(biāo)。他還指出,中國擁有比美國更多的系統(tǒng)工程師人才庫,他們知道如何最好地利用計(jì)算資源,以更便宜的方式訓(xùn)練和運(yùn)行模型。
盡管如此,美國的競爭對手也沒有停滯不前。它們正在構(gòu)建由英偉達(dá)新一代Blackwell芯片組成的超大型“集群”,從而創(chuàng)造出強(qiáng)大的計(jì)算能力,有可能再次拉開與中國競爭對手的性能差距。
就在硅谷審視與中國企業(yè)深度求索有關(guān)的新聞之際,Meta的首席執(zhí)行官扎克伯格宣布計(jì)劃在2025年大幅增加對人工智能的投資。他表示,今年將對該領(lǐng)域增加600億至650億美元的投資,同時(shí)大幅擴(kuò)大人工智能研發(fā)團(tuán)隊(duì)。人工智能和中國的發(fā)展態(tài)勢成為本周在瑞士達(dá)沃斯舉行的世界經(jīng)濟(jì)論壇2025年年會的主要話題。微軟高管也表示,應(yīng)非常認(rèn)真地對待來自中國的發(fā)展態(tài)勢。