從技術(shù)架構(gòu)看,CANN和CUDA都扮演著連接上層AI框架與底層芯片的核心角色。CUDA允許開發(fā)者利用英偉達GPU的并行計算能力,將數(shù)據(jù)并行構(gòu)造擴展到C語言編程中,實現(xiàn)復雜計算任務(wù)的加速。CANN則支持針對神經(jīng)網(wǎng)絡(luò)模型運算的專用指令集,可將神經(jīng)網(wǎng)絡(luò)算子離線編譯成NPU的專用指令序列,還能實現(xiàn)層間算子融合,減少DDR讀寫帶寬,提升性能。兼容性方面,CANN已能兼容80%的CUDA API,支持85%算子自動轉(zhuǎn)換。在部分場景中,CANN已經(jīng)具備了與國際產(chǎn)品競爭的實力。生態(tài)建設(shè)上,CUDA擁有先發(fā)優(yōu)勢,而CANN起步較晚但發(fā)展迅速。華為通過APN(昇騰伙伴計劃),已發(fā)展100多家伙伴,累計開發(fā)多款產(chǎn)品。
華為CANN開源的同時,國產(chǎn)芯片產(chǎn)業(yè)正迎來集體崛起。2025年上半年,以寒武紀為代表的國產(chǎn)芯片廠商表現(xiàn)亮眼。寒武紀上半年實現(xiàn)營業(yè)收入28.81億元,同比增長4347.82%。昆侖芯科技中標中國移動集采項目十億級訂單,在中國移動2025年至2026年人工智能通用計算設(shè)備集中采購項目中,昆侖芯在“類生態(tài)”的標包1、標包2和標包3中標份額分別為70%、100%。海光信息2025年上半年實現(xiàn)營業(yè)收入54.64億元,同比增長45.21%。這些國產(chǎn)芯片廠商的應用場景正從科技公司內(nèi)部自用為主,拓展至電信等重要領(lǐng)域。AI芯片國產(chǎn)替代已經(jīng)由“測試和試用”走向“大規(guī)模放量”的實質(zhì)性階段。
業(yè)內(nèi)認為,開源開放CANN架構(gòu)是改變芯片格局的重要一步。許多中國開發(fā)者選用英偉達的原因在于其平臺多年來已成為行業(yè)默認的開發(fā)環(huán)境。華為開源昇騰CANN架構(gòu),是中國產(chǎn)業(yè)的重要轉(zhuǎn)折。開發(fā)者可以像搭積木般自由組合算力模塊,打破技術(shù)壟斷的同時,為國產(chǎn)基礎(chǔ)軟件協(xié)同發(fā)展開辟新路徑。這種以開源促協(xié)同、以生態(tài)破壁壘的創(chuàng)新實踐,或?qū)⒊蔀槠平鈬a(chǎn)AI卡脖子困局的關(guān)鍵密鑰。清華大學計算機系教授翟季冬指出:“目前國內(nèi)算力硬件水平已經(jīng)接近甚至超過了英偉達同類芯片,但在軟件生態(tài)上仍有提升空間?!蓖晟栖浖鷳B(tài),底層系統(tǒng)中的調(diào)度器、內(nèi)存管理、容錯系統(tǒng)、存儲系統(tǒng),中層的編程語言、AI編譯器、算子庫,上層的編程框架、通信庫和并行系統(tǒng)幾乎缺一不可。
當全球科技界還在為英偉達H100的算力神話驚嘆時,華為在9月18日的全聯(lián)接大會上發(fā)布了一款名為Atlas960的超節(jié)點產(chǎn)品
2025-09-19 07:54:08華為萬卡集群挑戰(zhàn)英偉達勝算幾何