1月最后一天,DeepSeek的熱度依舊高漲。在美國,無論是AI從業(yè)者還是普通民眾,都感受到了來自中國AI技術(shù)的沖擊。Anthropic CEO呼吁美國加強(qiáng)芯片管制,而OpenAI則尋求高達(dá)400億美元的融資。網(wǎng)友們利用寬松的開源許可,制作了使用DeepSeek-R1替代OpenAI Operator的教程,無需200美元訂閱,完全免費(fèi)。
英偉達(dá)對DeepSeek贊賞有加,并宣布DeepSeek-R1正式登陸NVIDIA NIM。在單個(gè)NVIDIA HGX H200系統(tǒng)上,完整版DeepSeek-R1 671B的處理速度可達(dá)3,872 Token/秒。亞馬遜也在Amazon Bedrock和SageMaker AI中上線了DeepSeek-R1模型。微軟甚至提前將DeepSeek-R1部署在其云服務(wù)Azure上。
除了科技巨頭,初創(chuàng)公司也抓住機(jī)會(huì)。Windsurf編輯器集成了DeepSeek-R1和V3模型,在編程智能體中實(shí)現(xiàn)了R1的工具調(diào)用。Cerebras聲稱其部署的70B模型不僅比GPU快57倍,還在準(zhǔn)確率上超過了GPT-4o和o1-mini。
吳恩達(dá)認(rèn)為,圍繞DeepSeek的熱議顯示了幾個(gè)重要趨勢:中國在生成式AI領(lǐng)域正在趕上美國。盡管ChatGPT推出時(shí)美國明顯領(lǐng)先,但隨著Qwen、Kimi、InternVL和DeepSeek等模型的出現(xiàn),中國的差距迅速縮小。特別是在視頻生成等領(lǐng)域,中國已展現(xiàn)出一些領(lǐng)先優(yōu)勢。
DeepSeek-R1不僅開源了模型權(quán)重,還分享了一份詳細(xì)的技術(shù)報(bào)告。相比之下,一些美國公司通過渲染AI危險(xiǎn)來推動(dòng)法規(guī)阻止開源發(fā)展。吳恩達(dá)指出,如果美國繼續(xù)妨礙開源,這一環(huán)節(jié)可能由中國主導(dǎo)。
開放權(quán)重模型加速了LLM的Token價(jià)格下降,為開發(fā)者提供了更多選擇。例如,OpenAI的輸出價(jià)格為60美元/百萬Token,而DeepSeek R1只需2.19美元。訓(xùn)練基礎(chǔ)模型并提供API服務(wù)充滿挑戰(zhàn),許多公司仍在尋找收回成本的方法。但在基礎(chǔ)模型之上進(jìn)行應(yīng)用開發(fā),則充滿了商機(jī)。
關(guān)于通過擴(kuò)大模型規(guī)模推動(dòng)進(jìn)步的觀點(diǎn)很多,但DeepSeek團(tuán)隊(duì)因美國AI芯片禁令不得不在性能較低的H800 GPU上運(yùn)行模型,這促使他們在優(yōu)化方面進(jìn)行了大量創(chuàng)新。最終,模型訓(xùn)練成本(不包括研究成本)不到600萬美元。吳恩達(dá)認(rèn)為,即使智能變得更便宜,人類仍會(huì)使用更多智能。
DeepSeek的成功引起了英特爾前CEO Pat Gelsinger的關(guān)注。他認(rèn)為,針對DeepSeek的反應(yīng)忽視了計(jì)算機(jī)發(fā)展歷程中的三個(gè)教訓(xùn):計(jì)算遵循“氣體定律”,工程的本質(zhì)是應(yīng)對約束,以及開放終將勝利。DeepSeek展示了如何在資源受限的情況下以低得多的成本交付世界一流解決方案。此外,開放的研究和生態(tài)系統(tǒng)對于AI的未來發(fā)展至關(guān)重要。