然而,MI325X依舊存在明顯短板。與英偉達(dá)的產(chǎn)品相比,AMD在FP8(8位浮點數(shù))支持方面存在劣勢。由于軟件庫vLLM對FP8支持有限,AMD不得不在許多基準(zhǔn)測試中使用FP16,這意味著相同規(guī)模的AI模型在AMD芯片上需要更多內(nèi)存。
面對這些技術(shù)挑戰(zhàn),AMD已經(jīng)規(guī)劃了明確的產(chǎn)品路線圖。AMD計劃2025年推出MI355X,性能較MI325X再提升80%,并采用3nm工藝。更重要的是,AMD還暗示了代號為“CDNA next”的下一代產(chǎn)品將帶來“重大架構(gòu)升級”,可能包括異構(gòu)多芯片部署或光子內(nèi)存擴(kuò)展等創(chuàng)新技術(shù),并將支持FP4和FP6數(shù)據(jù)類型,這一改進(jìn)有望解決目前在低精度計算方面的短板。
除了技術(shù)創(chuàng)新,AMD還通過一系列戰(zhàn)略投資加強(qiáng)其在AI領(lǐng)域的競爭力。2024年7月,AMD以6.65億美元收購歐洲最大私人AI實驗室Silo AI。這家實驗室擁有300名專家,在開發(fā)定制化大語言模型和MLOps工具方面具有深厚積累。此次收購有效補(bǔ)強(qiáng)了AMD的AI服務(wù)能力:Silo AI能夠為客戶提供從模型訓(xùn)練到部署的全流程支持,而AMD則可以借此將硬件、軟件和服務(wù)整合為完整的“端到端解決方案”。值得一提的是,Silo AI為歐洲企業(yè)開發(fā)的“主權(quán)AI”模型(如支持歐盟多語言的Poro和Viking)已經(jīng)在AMD平臺上直接運(yùn)行,這為AMD在歐洲市場構(gòu)建起獨特的區(qū)域性優(yōu)勢。
2024年12月,AMD領(lǐng)投了MIT初創(chuàng)公司Liquid AI的2.5億美元A輪融資。Liquid AI提出的“液態(tài)神經(jīng)網(wǎng)絡(luò)”摒棄傳統(tǒng)Transformer架構(gòu),模仿線蟲神經(jīng)系統(tǒng)設(shè)計動態(tài)權(quán)重更新機(jī)制。其模型LFM-1B在自然語言處理任務(wù)中,以1/10的參數(shù)量達(dá)到同等規(guī)模模型的性能,且推理能效提升90%。這一技術(shù)有望解決Transformer在長序列建模和邊緣計算中的瓶頸。AMD的押注不僅是為了搶占下一代AI架構(gòu)的先機(jī),也是為了在英偉達(dá)主導(dǎo)的“大模型軍備競賽”外開辟新戰(zhàn)場。
AI芯片領(lǐng)域的領(lǐng)軍企業(yè)英偉達(dá)就近期關(guān)于其AI芯片延期發(fā)布的傳言進(jìn)行了回應(yīng)
2024-08-04 21:05:19英偉達(dá)回應(yīng)AI芯片推遲發(fā)布