深度開源助推AI大模型普惠“破圈” 開源潮熱度空前

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-03-04 12:49:59 中國青年報

過去的一周，DeepSeek帶動的人工智能大模型“開源潮”熱度空前。2月24日，國內(nèi)AI企業(yè)深度求索（DeepSeek）啟動“開源周”，計劃在一周內(nèi)每天開源一個代碼庫，以完全透明的方式與全球開發(fā)者分享他們的研究進展。3月1日，DeepSeek發(fā)布《DeepSeek-V3/R1推理系統(tǒng)概覽》技術(shù)文章，首次公布模型推理系統(tǒng)優(yōu)化細節(jié)，“開源周”就此收官。

五天時間里，DeepSeek開源了五個核心代碼庫，基本覆蓋了AI大模型開發(fā)的關(guān)鍵環(huán)節(jié)，如硬件性能高效利用、數(shù)據(jù)處理提速等，有助于降低技術(shù)門檻和成本。DeepSeek方面表示，希望分享的每一行代碼都能加速行業(yè)發(fā)展進程。開源不僅指開放源代碼，還應(yīng)包括開放資源。中國工程院院士王堅認為，在人工智能時代，開源是對社會和全世界的貢獻。

以2月24日DeepSeek向公眾開源的FlashMLA代碼庫為例，它針對Hopper GPU架構(gòu)開發(fā)，解決了大模型處理不同長度文本的問題。田豐解釋說，F(xiàn)lashMLA像可伸縮的快遞箱子，通過精準(zhǔn)分配GPU資源處理可變長度文本序列，實現(xiàn)高效解碼。除了FlashMLA，DeepSeek“開源周”還開放了DeepEP、DeepGEMM等關(guān)鍵技術(shù)。田豐認為，開源意味著企業(yè)免費提供研發(fā)成果給全球開發(fā)者，開發(fā)者在不同環(huán)境試用或迭代過程中會完善模型，推動技術(shù)快速迭代更新。

DeepSeek自成立以來一直堅持開源策略。今年年初，開源模型DeepSeek-R1推出后引發(fā)“接入潮”。如今，DeepSeek通過“開源周”進一步擴大開源程度，將有力助推AI大模型在模型、算力、應(yīng)用三個層面實現(xiàn)普惠“破圈”。在模型方面，DeepSeek打破了少數(shù)國際巨頭對頂尖大模型的技術(shù)壟斷；在算力方面，通過軟件優(yōu)化彌補硬件差距，讓全球開發(fā)者可以用個人級算力進行科研創(chuàng)新；在應(yīng)用方面，預(yù)計近期可能涌現(xiàn)出上百個行業(yè)應(yīng)用大模型，覆蓋農(nóng)業(yè)、工業(yè)、服務(wù)業(yè)等領(lǐng)域。

12 全文共 2 頁下一頁

關(guān)閉

深度開源助推AI大模型普惠“破圈” 開源潮熱度空前

相關(guān)新聞

今日熱點

頻道熱點