全球AI巨頭正加急抄DeepSeek作業(yè) 蒸餾技術引發(fā)市場震動(2)

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2025-03-04 09:44:35 搜狐網

然而，OpenAI認為DeepSeek可能利用蒸餾技術從其模型中提取信息，以訓練競爭產品，涉嫌違反其服務條款。對此，DeepSeek尚未作出回應。盡管蒸餾能夠大幅降低模型運行成本，行業(yè)專家也指出，這一技術在提升計算效率的同時，也不可避免地帶來一定的能力削弱。微軟研究院的Ahmed Awadallah指出：“當你縮小模型時，勢必會降低其泛化能力。例如，一個蒸餾后的模型可能非常擅長總結電子郵件內容，但在其他任務上的表現可能不盡如人意?！盋ox補充道：“只要蒸餾能顯著降低成本，同時提供符合預期的性能，就沒有理由不采用?！?/p>

這一趨勢也對AI巨頭的商業(yè)模式構成挑戰(zhàn)。即便開發(fā)者仍依賴OpenAI等公司的蒸餾模型，但由于這些模型計算成本更低，帶來的收入自然也相對減少。因此，OpenAI通常對蒸餾模型的使用收取較低費用，以匹配其較低的計算負載。OpenAI的Godement堅信，大型語言模型在“高智能、高風險任務”中仍不可或缺，企業(yè)愿意為高精準度和高可靠性支付更高的費用。此外，大模型依然是創(chuàng)新能力的源泉，未來的新突破也將依賴于這些模型，隨后再被蒸餾至更小的模型中。

與此同時，OpenAI也在積極防止其大模型被用于競爭性蒸餾。公司專門設立了監(jiān)控團隊，一旦發(fā)現用戶可能在大規(guī)模提取數據以訓練競爭產品，便會撤銷其訪問權限。例如，OpenAI據稱已采取措施限制與DeepSeek相關的賬戶訪問其模型。Contextual AI首席執(zhí)行官Douwe Kiela表示：“OpenAI一直試圖防止蒸餾被濫用，但完全避免幾乎是不可能的。”

另一方面，蒸餾的廣泛應用也被視為開源AI的勝利。這一技術使得開發(fā)者可以更自由地利用開源AI系統(tǒng)進行創(chuàng)新。例如，DeepSeek的最新模型也采用了開源方式，向全球開發(fā)者開放。Meta首席AI科學家Yann LeCun表示：“我們會立刻將蒸餾技術應用到產品中。這正是開源的精髓——所有人都能從彼此的進步中受益。”

蒸餾技術的崛起也讓AI行業(yè)的競爭變得更加復雜。盡管領先的AI公司投入數十億美元推動模型能力提升，但競爭對手可以借助蒸餾技術迅速跟進，正如DeepSeek的最新成果所展現的那樣。IBM的Cox表示：“在當今AI行業(yè)瞬息萬變的環(huán)境下，你可以投入巨資研發(fā)一個突破性的模型，但幾個月后，競爭對手就能用蒸餾技術迎頭趕上。這無疑讓AI市場變得更加復雜，商業(yè)模式也更加難以預測。”

首頁上一頁 12共 2 頁

(責任編輯：盧其龍 CN070)

關閉

全球AI巨頭正加急抄DeepSeek作業(yè) 蒸餾技術引發(fā)市場震動(2)

相關新聞

今日熱點

頻道熱點