1月27日,中國深度求索公司開發(fā)的DeepSeek在蘋果美國地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜上超越了ChatGPT。最近發(fā)布的開源模型DeepSeek-R1引起了全球范圍內(nèi)的廣泛關(guān)注。
輿論認(rèn)為,這一低成本、開源的人工智能模型震動了硅谷,讓競爭對手感到擔(dān)憂,也讓科學(xué)家們興奮不已。多方評論指出,中國AI技術(shù)的快速發(fā)展,讓美國的打壓政策顯得尷尬。1月20日,深度求索發(fā)布了最新開源模型DeepSeek-R1,此后熱度不斷上升,在國內(nèi)外引發(fā)了廣泛討論。頂級風(fēng)投A16Z創(chuàng)始人馬克·安德森評價稱,DeepSeek-R1是他見過的最驚人、最令人印象深刻的突破之一,并稱贊其為給世界的一份意義深遠(yuǎn)的禮物。
在硅谷,幾乎每個人都在談?wù)揇eepSeek。有報道稱,硅谷工程師正在瘋狂地分析DeepSeek,甚至有人將其稱為中國的“ChatGPT時刻”。DeepSeek的特點(diǎn)是低成本、高性能和開源。該模型的推理計算效率極高,可以與一些頂尖的AI模型相媲美,與硅谷前沿發(fā)展保持同步。
DeepSeek-R1在技術(shù)上實現(xiàn)了重要突破,用純深度學(xué)習(xí)的方法讓AI自發(fā)涌現(xiàn)出推理能力,在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上的性能比肩OpenAI的o1模型正式版。據(jù)DeepSeek介紹,R1的預(yù)訓(xùn)練費(fèi)用只有557.6萬美元,遠(yuǎn)低于OpenAI GPT-4o模型的訓(xùn)練成本。
加利福尼亞大學(xué)伯克利分校教授亞歷克斯·迪馬基表示,DeepSeek的技術(shù)路線揭示了一個事實:達(dá)到頂尖性能未必需要巨額投入,這對硅谷的燒錢競賽無異于釜底抽薪。開源也是DeepSeek備受關(guān)注的原因之一,這意味著其他企業(yè)和研究人員可以共享基礎(chǔ)代碼,構(gòu)建和發(fā)布自己的產(chǎn)品。
英偉達(dá)資深科學(xué)家吉姆·范稱贊DeepSeek是“非美國公司踐行OpenAI初心”的典范,通過開放技術(shù)細(xì)節(jié)和訓(xùn)練方法,為全球研究者賦能。德國馬克斯·普朗克光科學(xué)研究所的馬里奧·克倫也認(rèn)為,DeepSeek-R1的開源性非常出色,相比之下,o1和其他模型都是閉源模型“黑匣子”。
短短一個月內(nèi),中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外