在人工智能芯片的競(jìng)爭(zhēng)中,英偉達(dá)憑借其強(qiáng)大的技術(shù)實(shí)力和完整的生態(tài)系統(tǒng),構(gòu)筑了難以逾越的壁壘。然而,隨著AI應(yīng)用場(chǎng)景的擴(kuò)展,特別是在推理階段的需求爆發(fā),AMD等競(jìng)爭(zhēng)者正在尋找突破口。
最新消息顯示,AMD利用DeepSeek模型走紅的機(jī)會(huì),宣布將新的DeepSeek-V3模型集成到Instinct MI300X GPU上。這一集成旨在與SGLang配合使用,以實(shí)現(xiàn)最佳性能。DeepSeek-V3專門針對(duì)AI推理進(jìn)行了優(yōu)化,表明AMD正在積極布局AI應(yīng)用落地場(chǎng)景。
這種合作反映了AI行業(yè)格局的變化。過去兩年,大模型的訓(xùn)練需求主導(dǎo)了算力市場(chǎng),英偉達(dá)憑借CUDA生態(tài)和H100系列GPU占據(jù)絕對(duì)優(yōu)勢(shì)。但隨著大模型進(jìn)入應(yīng)用落地階段,推理需求激增,企業(yè)更關(guān)注成本、能效和部署靈活性。AMD瞄準(zhǔn)這一窗口期,試圖通過優(yōu)化推理性能打破英偉達(dá)的壟斷。
AMD的Instinct MI300X是其AI戰(zhàn)略的核心武器。這款采用Chiplet設(shè)計(jì)的GPU集成1460億晶體管,配備192GB HBM3內(nèi)存,專為大規(guī)模AI推理設(shè)計(jì)。據(jù)AMD數(shù)據(jù),MI300X的推理性能較英偉達(dá)H100提升30%,內(nèi)存帶寬達(dá)5.3TB/s,尤其擅長(zhǎng)實(shí)時(shí)對(duì)話、圖像生成等低延遲任務(wù)。不過,MI300X面臨生態(tài)短板和產(chǎn)能瓶頸兩大挑戰(zhàn)。
英偉達(dá)的CUDA生態(tài)已形成近乎壟斷的開發(fā)者壁壘,全球90%的AI框架依賴其工具鏈。盡管AMD推出開源的ROCm平臺(tái)并適配PyTorch、TensorFlow,但遷移成本高、社區(qū)支持不足的問題依然突出。例如,Meta雖采用MI300X運(yùn)行Llama 3.1模型的推理任務(wù),但訓(xùn)練階段仍依賴英偉達(dá)芯片。此外,2023年底臺(tái)積電先進(jìn)封裝產(chǎn)能緊張導(dǎo)致MI300X交付延遲,部分客戶轉(zhuǎn)投英偉達(dá),也暴露出AMD在供應(yīng)鏈管理上的脆弱性。
為應(yīng)對(duì)挑戰(zhàn),AMD加速硬件迭代并強(qiáng)化生態(tài)合作。2024年6月,AMD推出了升級(jí)版的MI325X芯片,這款產(chǎn)品采用了8個(gè)計(jì)算芯片、4個(gè)I/O芯片和8個(gè)內(nèi)存芯片的復(fù)雜設(shè)計(jì),通過2.5D和3D封裝技術(shù)實(shí)現(xiàn)整合。在性能方面,MI325X提供了1.3petaFLOPS的BF/FP16性能,或2.6petaFLOPS的FP8性能,超過了英偉達(dá)的H200。特別是在內(nèi)存容量上,MI325X配備了288GB的HBM3e內(nèi)存,是H200的兩倍多,內(nèi)存帶寬達(dá)到6TB/S。
然而,MI325X依舊存在明顯短板。與英偉達(dá)的產(chǎn)品相比,AMD在FP8(8位浮點(diǎn)數(shù))支持方面存在劣勢(shì)。由于軟件庫vLLM對(duì)FP8支持有限,AMD不得不在許多基準(zhǔn)測(cè)試中使用FP16,這意味著相同規(guī)模的AI模型在AMD芯片上需要更多內(nèi)存。
面對(duì)這些技術(shù)挑戰(zhàn),AMD已經(jīng)規(guī)劃了明確的產(chǎn)品路線圖。AMD計(jì)劃2025年推出MI355X,性能較MI325X再提升80%,并采用3nm工藝。更重要的是,AMD還暗示了代號(hào)為“CDNA next”的下一代產(chǎn)品將帶來“重大架構(gòu)升級(jí)”,可能包括異構(gòu)多芯片部署或光子內(nèi)存擴(kuò)展等創(chuàng)新技術(shù),并將支持FP4和FP6數(shù)據(jù)類型,這一改進(jìn)有望解決目前在低精度計(jì)算方面的短板。
除了技術(shù)創(chuàng)新,AMD還通過一系列戰(zhàn)略投資加強(qiáng)其在AI領(lǐng)域的競(jìng)爭(zhēng)力。2024年7月,AMD以6.65億美元收購(gòu)歐洲最大私人AI實(shí)驗(yàn)室Silo AI。這家實(shí)驗(yàn)室擁有300名專家,在開發(fā)定制化大語言模型和MLOps工具方面具有深厚積累。此次收購(gòu)有效補(bǔ)強(qiáng)了AMD的AI服務(wù)能力:Silo AI能夠?yàn)榭蛻籼峁哪P陀?xùn)練到部署的全流程支持,而AMD則可以借此將硬件、軟件和服務(wù)整合為完整的“端到端解決方案”。值得一提的是,Silo AI為歐洲企業(yè)開發(fā)的“主權(quán)AI”模型(如支持歐盟多語言的Poro和Viking)已經(jīng)在AMD平臺(tái)上直接運(yùn)行,這為AMD在歐洲市場(chǎng)構(gòu)建起獨(dú)特的區(qū)域性優(yōu)勢(shì)。
2024年12月,AMD領(lǐng)投了MIT初創(chuàng)公司Liquid AI的2.5億美元A輪融資。Liquid AI提出的“液態(tài)神經(jīng)網(wǎng)絡(luò)”摒棄傳統(tǒng)Transformer架構(gòu),模仿線蟲神經(jīng)系統(tǒng)設(shè)計(jì)動(dòng)態(tài)權(quán)重更新機(jī)制。其模型LFM-1B在自然語言處理任務(wù)中,以1/10的參數(shù)量達(dá)到同等規(guī)模模型的性能,且推理能效提升90%。這一技術(shù)有望解決Transformer在長(zhǎng)序列建模和邊緣計(jì)算中的瓶頸。AMD的押注不僅是為了搶占下一代AI架構(gòu)的先機(jī),也是為了在英偉達(dá)主導(dǎo)的“大模型軍備競(jìng)賽”外開辟新戰(zhàn)場(chǎng)。
2025年1月,AMD又以2000萬美元投資AI制藥公司Absci,首次進(jìn)軍生命科學(xué)領(lǐng)域。Absci利用AI從頭設(shè)計(jì)抗體,借助AMD的MI300X芯片,其“集成藥物創(chuàng)造平臺(tái)”可將抗體設(shè)計(jì)周期縮短至6周。AMD看中的是生命科學(xué)領(lǐng)域?qū)Ω咝评淼男枨蟆驕y(cè)序、蛋白質(zhì)模擬等任務(wù)需要海量并行計(jì)算,而英偉達(dá)在該市場(chǎng)的布局尚未形成壁壘。與Absci合作,將幫助AMD擴(kuò)大芯片應(yīng)用場(chǎng)景,還可積累生物計(jì)算領(lǐng)域的專屬優(yōu)化經(jīng)驗(yàn)。
盡管AMD在某些關(guān)鍵AI任務(wù)上能夠提供更快的速度和更低的價(jià)格,但英偉達(dá)的優(yōu)勢(shì)仍然明顯。英偉達(dá)CEO黃仁勛曾表示,即使競(jìng)爭(zhēng)對(duì)手的芯片免費(fèi)提供,從總擁有成本來看也無法與英偉達(dá)競(jìng)爭(zhēng)。這種底氣源自英偉達(dá)在AI軟件生態(tài)系統(tǒng)和整體解決方案方面長(zhǎng)期建立的優(yōu)勢(shì)地位。
另一方面,亞馬遜、谷歌等云廠商自研AI芯片也在持續(xù)擠壓第三方供應(yīng)商的空間。此外,地緣政治風(fēng)險(xiǎn)也不容忽視——美國(guó)對(duì)華芯片出口限制也在迫使AMD調(diào)整中國(guó)市場(chǎng)策略,而英偉達(dá)憑借更早的全球化布局更具韌性。
不過,市場(chǎng)格局正在發(fā)生變化。隨著AI芯片的主戰(zhàn)場(chǎng)從訓(xùn)練向推理階段轉(zhuǎn)移,性價(jià)比和能效比將變得越來越重要。一些機(jī)構(gòu)已經(jīng)開始考慮在推理任務(wù)中使用替代方案,原因是英偉達(dá)芯片的價(jià)格和能耗都相對(duì)較高。這為AMD等競(jìng)爭(zhēng)者提供了機(jī)會(huì)。
在接受《時(shí)代》雜志采訪時(shí),AMD CEO蘇姿豐表示,AI是一個(gè)重大的技術(shù)變革機(jī)遇。她強(qiáng)調(diào),AMD的優(yōu)勢(shì)在于能夠提供端到端的AI解決方案,并在與合作伙伴協(xié)作方面表現(xiàn)出色。這種戰(zhàn)略思維反映在AMD的投資布局上,從芯片研發(fā)到軟件優(yōu)化,從人才儲(chǔ)備到應(yīng)用場(chǎng)景拓展,AMD正在構(gòu)建全方位的AI生態(tài)系統(tǒng)。
展望未來,雖然短期內(nèi)難以撼動(dòng)英偉達(dá)的主導(dǎo)地位,但隨著AI應(yīng)用場(chǎng)景的不斷豐富和市場(chǎng)需求的持續(xù)增長(zhǎng),AMD通過技術(shù)創(chuàng)新和戰(zhàn)略投資,正在逐步縮小與領(lǐng)導(dǎo)者的差距。在這場(chǎng)技術(shù)變革中,最終的贏家可能是能夠?yàn)椴煌瑧?yīng)用場(chǎng)景提供最優(yōu)解決方案的參與者。
AI芯片領(lǐng)域的領(lǐng)軍企業(yè)英偉達(dá)就近期關(guān)于其AI芯片延期發(fā)布的傳言進(jìn)行了回應(yīng)
2024-08-04 21:05:19英偉達(dá)回應(yīng)AI芯片推遲發(fā)布