當全球都在慶祝圣誕節(jié)時,中國的一個實驗室發(fā)布了令人矚目的AI模型。這一事件引起了廣泛關注。長期以來,美國在AI領域占據(jù)主導地位,但DeepSeek的最新模型改變了這一格局。短短半個月內(nèi),這款來自中國的AI模型以其卓越的表現(xiàn)震撼了硅谷。
DeepSeek成立于2023年,去年年底發(fā)布了一個免費開源的大語言模型。根據(jù)其論文,DeepSeek-R1在多個數(shù)學和推理基準測試中超越了行業(yè)領先的OpenAI等模型,在性能、成本、開放性等方面也表現(xiàn)出色。在一系列第三方基準測試中,DeepSeek的模型在復雜問題解決、數(shù)學和編程等多個領域的準確性上超越了Meta的Llama 3.1、OpenAI的GPT-4以及Anthropic的Claude Sonnet 3.5。
上周,DeepSeek又發(fā)布了推理模型R1,在AIME 2024數(shù)學基準測試中取得了79.8%的成功率,超過了OpenAI的最新模型。在標準化編碼測試中,它展示了“專家級”的表現(xiàn),在Codeforces上獲得了2,029的Elo評分,超過96.3%的人類競爭對手。Scale AI使用“人類最后考試”來測試AI大模型,結果顯示DeepSeek的最新模型表現(xiàn)最出色或與最好的美國模型不相上下。
DeepSeek在美國AI行業(yè)引發(fā)了巨大反響,幾乎所有主流媒體和科技媒體都報道了這一消息。短短幾天內(nèi),DeepSeek成為蘋果應用商店排名第一的免費應用,超越了OpenAI的ChatGPT。
除了性能卓越,DeepSeek的成本也極為低廉。R1模型的查詢成本僅為每百萬個token 0.14美元,而OpenAI的成本為7.50美元,使其成本降低了98%。DeepSeek僅用兩個月時間,耗費不到600萬美元就打造了大語言模型R1,使用的還是性能較弱的英偉達H800芯片。這種低成本和高效率讓硅谷巨頭們感到震驚。
過去一周,中國的人工智能大模型成為硅谷乃至全球科技界的熱議話題。引發(fā)這場討論的是中國人工智能初創(chuàng)公司深度求索(DeepSeek)
2025-01-27 10:02:46幻方DeepSeek如何震驚硅谷短短一個月內(nèi),中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 08:21:32DeepSeek大模型強在哪白頭鷹再次針對一家小公司采取行動,使用的依舊是那些熟悉的手段。近期,一家初創(chuàng)公司推出的DeepSeek軟件在全球范圍內(nèi)引起轟動,在160多個國家的AI軟件下載排行榜上位居榜首
2025-02-04 19:33:47DeepSeek美股泡沫得以延續(xù)中國國產(chǎn)大模型Deepseek在硅谷引起了轟動。從斯坦福到麻省理工,Deepseek R1幾乎一夜之間成為美國頂尖大學研究人員的首選模型
2025-01-27 15:33:19媒體揭秘國產(chǎn)大模型DeepSeek短短一個月內(nèi),中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型——DeepSeek-V3和DeepSeek-R1
2025-01-26 10:34:01DeepSeek讓Meta深陷恐慌