全球AI巨頭正加急抄DeepSeek作業(yè)!在全球人工智能競賽日益激烈的背景下,OpenAI、微軟和Meta等行業(yè)巨頭正紛紛押注“蒸餾”技術,以降低AI模型的成本,提高其普及率,使企業(yè)和消費者更容易獲取先進的AI能力。這一技術在中國初創(chuàng)公司DeepSeek利用開源系統(tǒng)(如Meta和阿里巴巴的模型)打造高效AI模型后迅速擴大影響力。DeepSeek的突破不僅挑戰(zhàn)了硅谷在AI領域的領導地位,也引發(fā)市場震動,導致華爾街投資者對美國科技巨頭信心下降,使其市值蒸發(fā)數十億美元。
蒸餾的核心原理是利用一個大型語言模型生成預測數據,并用這些數據來訓練更小、更高效的模型,從而將大模型的知識快速遷移到小模型上。盡管蒸餾技術已存在多年,最近的技術突破讓行業(yè)專家普遍認為,它將成為AI創(chuàng)業(yè)公司的“降本增效”利器,使其能夠在不依賴龐大算力的情況下構建高效AI應用。OpenAI平臺產品負責人Olivier Godement表示:“蒸餾是一種近乎神奇的技術,它能夠利用一個極其強大的前沿大模型,讓其‘教授’一個更小、更專注于特定任務的模型,使其擁有極快的執(zhí)行速度和極低的計算成本。”
全球AI巨頭正加急抄DeepSeek作業(yè) 蒸餾技術引發(fā)市場震動
像GPT-4、谷歌的Gemini和Meta的Llama這樣的超大規(guī)模語言模型,訓練和維護成本極為昂貴,盡管相關公司未披露具體數字,但業(yè)內普遍認為這一費用高達數億美元。蒸餾技術的應用使得開發(fā)者和企業(yè)能夠以極低成本訪問大模型的核心能力,從而讓AI應用能夠更高效地運行在筆記本電腦、智能手機等設備上,加速AI技術的普及。微軟作為OpenAI的最大投資者之一,累計投資近140億美元,利用GPT-4蒸餾出小型語言模型Phi,推動其商業(yè)化落地。
然而,OpenAI認為DeepSeek可能利用蒸餾技術從其模型中提取信息,以訓練競爭產品,涉嫌違反其服務條款。對此,DeepSeek尚未作出回應。盡管蒸餾能夠大幅降低模型運行成本,行業(yè)專家也指出,這一技術在提升計算效率的同時,也不可避免地帶來一定的能力削弱。微軟研究院的Ahmed Awadallah指出:“當你縮小模型時,勢必會降低其泛化能力。例如,一個蒸餾后的模型可能非常擅長總結電子郵件內容,但在其他任務上的表現可能不盡如人意。”Cox補充道:“只要蒸餾能顯著降低成本,同時提供符合預期的性能,就沒有理由不采用?!?/p>
這一趨勢也對AI巨頭的商業(yè)模式構成挑戰(zhàn)。即便開發(fā)者仍依賴OpenAI等公司的蒸餾模型,但由于這些模型計算成本更低,帶來的收入自然也相對減少。因此,OpenAI通常對蒸餾模型的使用收取較低費用,以匹配其較低的計算負載。OpenAI的Godement堅信,大型語言模型在“高智能、高風險任務”中仍不可或缺,企業(yè)愿意為高精準度和高可靠性支付更高的費用。此外,大模型依然是創(chuàng)新能力的源泉,未來的新突破也將依賴于這些模型,隨后再被蒸餾至更小的模型中。
與此同時,OpenAI也在積極防止其大模型被用于競爭性蒸餾。公司專門設立了監(jiān)控團隊,一旦發(fā)現用戶可能在大規(guī)模提取數據以訓練競爭產品,便會撤銷其訪問權限。例如,OpenAI據稱已采取措施限制與DeepSeek相關的賬戶訪問其模型。Contextual AI首席執(zhí)行官Douwe Kiela表示:“OpenAI一直試圖防止蒸餾被濫用,但完全避免幾乎是不可能的?!?/p>
另一方面,蒸餾的廣泛應用也被視為開源AI的勝利。這一技術使得開發(fā)者可以更自由地利用開源AI系統(tǒng)進行創(chuàng)新。例如,DeepSeek的最新模型也采用了開源方式,向全球開發(fā)者開放。Meta首席AI科學家Yann LeCun表示:“我們會立刻將蒸餾技術應用到產品中。這正是開源的精髓——所有人都能從彼此的進步中受益?!?/p>
蒸餾技術的崛起也讓AI行業(yè)的競爭變得更加復雜。盡管領先的AI公司投入數十億美元推動模型能力提升,但競爭對手可以借助蒸餾技術迅速跟進,正如DeepSeek的最新成果所展現的那樣。IBM的Cox表示:“在當今AI行業(yè)瞬息萬變的環(huán)境下,你可以投入巨資研發(fā)一個突破性的模型,但幾個月后,競爭對手就能用蒸餾技術迎頭趕上。這無疑讓AI市場變得更加復雜,商業(yè)模式也更加難以預測?!?/p>
近日,騰訊、百度、阿里等國內互聯(lián)網企業(yè)紛紛宣布與DeepSeek合作,人工智能領域的“朋友圈”不斷擴大,引起業(yè)界高度關注
2025-02-22 23:32:37媒體我們需要更多的DeepSeek。過去幾年里,中國大模型從業(yè)者們經常被問及中國距離追上ChatGPT還有多遠。2025年初,這個問題有了新的答案
2025-02-21 17:49:36DeepSeek爆火DeepSeek R1的推出給全球AI行業(yè)帶來了新的變數。面對這一沖擊,美國兩大AI巨頭Anthropic與OpenAI迅速做出回應,試圖緩解市場對其技術領先地位的擔憂
2025-02-01 11:20:01美大模型巨頭