全球AI巨頭正加急抄DeepSeek作業(yè)!在全球人工智能競賽日益激烈的背景下,OpenAI、微軟和Meta等行業(yè)巨頭正紛紛押注“蒸餾”技術(shù),以降低AI模型的成本,提高其普及率,使企業(yè)和消費(fèi)者更容易獲取先進(jìn)的AI能力。這一技術(shù)在中國初創(chuàng)公司DeepSeek利用開源系統(tǒng)(如Meta和阿里巴巴的模型)打造高效AI模型后迅速擴(kuò)大影響力。DeepSeek的突破不僅挑戰(zhàn)了硅谷在AI領(lǐng)域的領(lǐng)導(dǎo)地位,也引發(fā)市場震動,導(dǎo)致華爾街投資者對美國科技巨頭信心下降,使其市值蒸發(fā)數(shù)十億美元。
蒸餾的核心原理是利用一個大型語言模型生成預(yù)測數(shù)據(jù),并用這些數(shù)據(jù)來訓(xùn)練更小、更高效的模型,從而將大模型的知識快速遷移到小模型上。盡管蒸餾技術(shù)已存在多年,最近的技術(shù)突破讓行業(yè)專家普遍認(rèn)為,它將成為AI創(chuàng)業(yè)公司的“降本增效”利器,使其能夠在不依賴龐大算力的情況下構(gòu)建高效AI應(yīng)用。OpenAI平臺產(chǎn)品負(fù)責(zé)人Olivier Godement表示:“蒸餾是一種近乎神奇的技術(shù),它能夠利用一個極其強(qiáng)大的前沿大模型,讓其‘教授’一個更小、更專注于特定任務(wù)的模型,使其擁有極快的執(zhí)行速度和極低的計(jì)算成本?!?/p>
全球AI巨頭正加急抄DeepSeek作業(yè) 蒸餾技術(shù)引發(fā)市場震動
像GPT-4、谷歌的Gemini和Meta的Llama這樣的超大規(guī)模語言模型,訓(xùn)練和維護(hù)成本極為昂貴,盡管相關(guān)公司未披露具體數(shù)字,但業(yè)內(nèi)普遍認(rèn)為這一費(fèi)用高達(dá)數(shù)億美元。蒸餾技術(shù)的應(yīng)用使得開發(fā)者和企業(yè)能夠以極低成本訪問大模型的核心能力,從而讓AI應(yīng)用能夠更高效地運(yùn)行在筆記本電腦、智能手機(jī)等設(shè)備上,加速AI技術(shù)的普及。微軟作為OpenAI的最大投資者之一,累計(jì)投資近140億美元,利用GPT-4蒸餾出小型語言模型Phi,推動其商業(yè)化落地。
我們需要更多的DeepSeek。過去幾年里,中國大模型從業(yè)者們經(jīng)常被問及中國距離追上ChatGPT還有多遠(yuǎn)。2025年初,這個問題有了新的答案
2025-02-21 17:49:36DeepSeek爆火