外媒：中國AI模型震驚硅谷小公司挑戰(zhàn)巨頭

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-26 14:31:00 環(huán)球網(wǎng)

中國一家人工智能實(shí)驗(yàn)室最近發(fā)布了一款尖端模型的技術(shù)細(xì)節(jié)，此舉不僅震驚了世界，也讓其低調(diào)的負(fù)責(zé)人梁文鋒成為民族英雄。1月20日，由對沖基金經(jīng)理梁文鋒創(chuàng)立的公司深度求索正式發(fā)布了R1模型，并在一篇論文中詳細(xì)解釋了如何利用有限的自籌預(yù)算構(gòu)建一個(gè)大語言模型，該模型可在沒有人工監(jiān)督的情況下自動(dòng)學(xué)習(xí)和自我改善。

包括OpenAI和谷歌DeepMind在內(nèi)的美國企業(yè)率先開發(fā)出推理模型，這是一個(gè)相對較新的人工智能研究領(lǐng)域，旨在使模型具有與人類相匹配的認(rèn)知能力。上個(gè)月，OpenAI發(fā)布了o1模型的完整版本，但對其創(chuàng)建方法保密。深度求索R1模型的發(fā)布在硅谷引發(fā)了一場激烈辯論，討論資源更雄厚的美國人工智能企業(yè)能否守住技術(shù)優(yōu)勢。與此同時(shí)，梁文鋒也成為提升中國國內(nèi)民族自豪感的焦點(diǎn)人物。本周，在中國總理召開的一次座談會中，梁文鋒是唯一的人工智能企業(yè)負(fù)責(zé)人。

2023年，梁文鋒創(chuàng)建了深度求索公司。另一家大語言模型公司的創(chuàng)始人表示，他建立了一個(gè)出色的基礎(chǔ)設(shè)施團(tuán)隊(duì)，真正了解芯片的工作原理。在美國禁止英偉達(dá)向中國出口功能最強(qiáng)大的芯片后，中國本土人工智能企業(yè)被迫尋找創(chuàng)新方法，以最大限度地利用現(xiàn)有芯片的計(jì)算能力。深度求索的工程師已經(jīng)知道如何解決這一問題，能夠釋放這些圖形處理器（GPU）的潛力，即使它們不是最先進(jìn)的。

業(yè)內(nèi)人士認(rèn)為，深度求索對研究的專注使其成為一個(gè)可畏的競爭對手，因?yàn)樵摴驹敢夥窒砣〉玫耐黄?，而非為獲取商業(yè)利益保護(hù)它們。深度求索沒有從外部基金籌集資金，也沒有采取重大舉措將其模型貨幣化。北京的一名人工智能行業(yè)投資者表示，深度求索的運(yùn)作方式就像早期的DeepMind，專注于研究和工程。

深度求索僅用2048顆英偉達(dá)H800 GPU和560萬美元就訓(xùn)練出了6710億參數(shù)的開源大模型，這只是OpenAI和谷歌訓(xùn)練同等類型模型花費(fèi)的一小部分。加州大學(xué)伯克利分校的人工智能政策研究員里特維克·古普塔表示，深度求索最近發(fā)布的模型表明，沒有阻礙人們獲取人工智能能力的障礙。他說，訓(xùn)練模型的第一人必須花費(fèi)大量資源才能實(shí)現(xiàn)目的，但跟進(jìn)者可以用更少的費(fèi)用且更快的速度實(shí)現(xiàn)目標(biāo)。他還指出，中國擁有比美國更多的系統(tǒng)工程師人才庫，他們知道如何最好地利用計(jì)算資源，以更便宜的方式訓(xùn)練和運(yùn)行模型。

盡管如此，美國的競爭對手也沒有停滯不前。它們正在構(gòu)建由英偉達(dá)新一代Blackwell芯片組成的超大型“集群”，從而創(chuàng)造出強(qiáng)大的計(jì)算能力，有可能再次拉開與中國競爭對手的性能差距。

就在硅谷審視與中國企業(yè)深度求索有關(guān)的新聞之際，Meta的首席執(zhí)行官扎克伯格宣布計(jì)劃在2025年大幅增加對人工智能的投資。他表示，今年將對該領(lǐng)域增加600億至650億美元的投資，同時(shí)大幅擴(kuò)大人工智能研發(fā)團(tuán)隊(duì)。人工智能和中國的發(fā)展態(tài)勢成為本周在瑞士達(dá)沃斯舉行的世界經(jīng)濟(jì)論壇2025年年會的主要話題。微軟高管也表示，應(yīng)非常認(rèn)真地對待來自中國的發(fā)展態(tài)勢。

(責(zé)任編輯：張小花 TT1000)

關(guān)閉

外媒：中國AI模型震驚硅谷 小公司挑戰(zhàn)巨頭

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

外媒：中國AI模型震驚硅谷小公司挑戰(zhàn)巨頭