DeepSeek選擇了一條與OpenAI截然不同的技術路線,完全摒棄了傳統(tǒng)的監(jiān)督微調環(huán)節(jié),依賴強化學習進行訓練。DeepSeek創(chuàng)始人梁文鋒強調原創(chuàng)的重要性,他認為只有通過原創(chuàng)才能擺脫追隨者的地位。OpenAI首席執(zhí)行官山姆·阿爾特曼承認DeepSeek是一個非常好的模型,并表示將推出更好的模型。
科技巨頭如微軟、AWS和英偉達紛紛接入DeepSeek-R1模型服務。微軟將其添加到Azure AI Foundry,AWS也在其平臺上部署了DeepSeek-R1。英偉達宣布DeepSeek-R1作為NVIDIA NIM微服務預覽版發(fā)布。AMD也宣布DeepSeek-V3模型已集成至AMD Instinct GPU上。
DeepSeek的出現(xiàn)引發(fā)了對AI未來發(fā)展的討論。吳恩達提醒,擴大規(guī)模并非實現(xiàn)AI進步的唯一途徑,算法創(chuàng)新同樣重要。隨著訓練成本降低和技術成熟,大語言模型將愈發(fā)成為一種普通產(chǎn)品。Hugging Face聯(lián)合創(chuàng)始人托馬斯?沃爾夫認為,許多這類模型將會免費且可自由獲取。巧合的是,同日,OpenAI推出了全新推理模型o3-mini,并首次向免費用戶開放。Sam Altman罕見承認OpenAI過去在開源方面站在“歷史錯誤的一邊”,并表示需要想出一個不同的開源策略。
今年春節(jié),一款名為DeepSeek R1的中國大模型在全球AI圈引起了廣泛關注。這款模型直接對標了OpenAI去年9月發(fā)布的OpenAI o1系列模型
2025-02-10 14:32:11DeepSeek撼動AI生態(tài)游戲規(guī)則過去一周,中國的人工智能大模型成為硅谷乃至全球科技界的熱議話題。引發(fā)這場討論的是中國人工智能初創(chuàng)公司深度求索(DeepSeek)
2025-01-27 10:02:46幻方DeepSeek如何震驚硅谷