華為超級節(jié)點挑戰(zhàn)英偉達霸權 開源打破壟斷!2025年9月,華為即將召開全面開源開放專題會議,這場原本技術圈的專業(yè)會議正悄然引發(fā)全球產(chǎn)業(yè)的高度關注。
九月的一個平常早晨,北京中關村某科技公司的AI工程師張偉打開電腦,驚喜地發(fā)現(xiàn)華為開源社區(qū)發(fā)布了架構(gòu)的最新代碼庫。他不再需要申請?zhí)厥鈾嘞?,就能直接訪問華為昇騰芯片的核心開發(fā)工具。與此同時,在美國加州圣克拉市,英偉達總部的高級工程師團隊正在緊急開會,討論如何應對華為這一舉動。他們知道,這不僅僅是技術的競爭,更是生態(tài)系統(tǒng)的對決。
英偉達的CUDA生態(tài)并非一朝一夕建成。2006年,當英偉達推出并行計算平臺時,很少有人預見到它將成為時代的“隱形操作系統(tǒng)”。經(jīng)過近20年的發(fā)展,CUDA已經(jīng)成為一個龐大且完善的體系,擁有超過400萬開發(fā)人員,支持多個應用程序,累計下載量達4500萬次。幾乎所有主流深度學習框架如PyTorch和TensorFlow等都原生支持CUDA。在深度學習訓練、科學研究、圖像處理等領域,CUDA幾乎成為默認選擇。這種壟斷地位帶來的不僅是技術優(yōu)勢,還有巨大的商業(yè)壁壘。從CUDA遷移到其他平臺,開發(fā)者往往需要重寫大量代碼,面臨高昂的遷移成本。
2025年8月,華為輪值董事長徐直軍在昇騰計算產(chǎn)業(yè)發(fā)展峰會上宣布,華為昇騰硬件使能將全面開源開放,Mind系列應用使能套件及工具鏈也將全面開源。一個月后的9日,華為將召開全面開源開放專題會議,進一步推動這一開源計劃的落地。CANN是華為面向推出的端云一致的異構(gòu)計算架構(gòu),能夠為各種人工智能模型和算法提供統(tǒng)一接入和運行環(huán)境,通過協(xié)同調(diào)度設備的CPU等硬件資源,實現(xiàn)高效設備端智能計算性能優(yōu)化。CANN平臺的目的很明確:就是要打破英偉達對于開發(fā)生態(tài)的壟斷,提供在國產(chǎn)芯片上構(gòu)建應用的替代平臺。
從技術架構(gòu)看,CANN和CUDA都扮演著連接上層AI框架與底層芯片的核心角色。CUDA允許開發(fā)者利用英偉達GPU的并行計算能力,將數(shù)據(jù)并行構(gòu)造擴展到C語言編程中,實現(xiàn)復雜計算任務的加速。CANN則支持針對神經(jīng)網(wǎng)絡模型運算的專用指令集,可將神經(jīng)網(wǎng)絡算子離線編譯成NPU的專用指令序列,還能實現(xiàn)層間算子融合,減少DDR讀寫帶寬,提升性能。兼容性方面,CANN已能兼容80%的CUDA API,支持85%算子自動轉(zhuǎn)換。在部分場景中,CANN已經(jīng)具備了與國際產(chǎn)品競爭的實力。生態(tài)建設上,CUDA擁有先發(fā)優(yōu)勢,而CANN起步較晚但發(fā)展迅速。華為通過APN(昇騰伙伴計劃),已發(fā)展100多家伙伴,累計開發(fā)多款產(chǎn)品。
華為CANN開源的同時,國產(chǎn)芯片產(chǎn)業(yè)正迎來集體崛起。2025年上半年,以寒武紀為代表的國產(chǎn)芯片廠商表現(xiàn)亮眼。寒武紀上半年實現(xiàn)營業(yè)收入28.81億元,同比增長4347.82%。昆侖芯科技中標中國移動集采項目十億級訂單,在中國移動2025年至2026年人工智能通用計算設備集中采購項目中,昆侖芯在“類生態(tài)”的標包1、標包2和標包3中標份額分別為70%、100%。海光信息2025年上半年實現(xiàn)營業(yè)收入54.64億元,同比增長45.21%。這些國產(chǎn)芯片廠商的應用場景正從科技公司內(nèi)部自用為主,拓展至電信等重要領域。AI芯片國產(chǎn)替代已經(jīng)由“測試和試用”走向“大規(guī)模放量”的實質(zhì)性階段。
業(yè)內(nèi)認為,開源開放CANN架構(gòu)是改變芯片格局的重要一步。許多中國開發(fā)者選用英偉達的原因在于其平臺多年來已成為行業(yè)默認的開發(fā)環(huán)境。華為開源昇騰CANN架構(gòu),是中國產(chǎn)業(yè)的重要轉(zhuǎn)折。開發(fā)者可以像搭積木般自由組合算力模塊,打破技術壟斷的同時,為國產(chǎn)基礎軟件協(xié)同發(fā)展開辟新路徑。這種以開源促協(xié)同、以生態(tài)破壁壘的創(chuàng)新實踐,或?qū)⒊蔀槠平鈬a(chǎn)AI卡脖子困局的關鍵密鑰。清華大學計算機系教授翟季冬指出:“目前國內(nèi)算力硬件水平已經(jīng)接近甚至超過了英偉達同類芯片,但在軟件生態(tài)上仍有提升空間。”完善軟件生態(tài),底層系統(tǒng)中的調(diào)度器、內(nèi)存管理、容錯系統(tǒng)、存儲系統(tǒng),中層的編程語言、AI編譯器、算子庫,上層的編程框架、通信庫和并行系統(tǒng)幾乎缺一不可。
華為開源CANN的決策,發(fā)生在全球算力需求爆增的背景下。OpenAI已與Oracle公司簽訂了價值3000億美元的算力購買訂單,為期約5年。作為大模型領域的領先公司,OpenAI對算力基礎設施的大規(guī)模投資是行業(yè)前瞻指標。Bernstein 7月發(fā)布的研報表示,2025年國內(nèi)芯片需求將達到395億美元,芯片市場的本土化率將從2023年的17%增長到2027年的55%??萍季揞^在AI芯片領域的動作頻頻,百度、阿里巴巴等公司紛紛加碼自研芯片,試圖在激烈的市場競爭中掌握主動權。阿里宣布未來三年投入3800億元建設云和硬件基礎設施,百度則推出了昆侖芯超節(jié)點在百舸計算平臺5.0版本上可用。
盡管CANN取得了顯著進展,但與英偉達相比,仍存在一定差距。CUDA擁有先發(fā)優(yōu)勢,已構(gòu)建起極為龐大和完善的生態(tài)系統(tǒng)。在生態(tài)豐富度和易用性上,CANN仍有差距,需要更多時間和努力來吸引開發(fā)者,完善工具和庫資源,提升整體生態(tài)的成熟度。從AI技術的發(fā)展方向來看,大模型是算力需求量最大的下游應用領域?;谟ミ_在深度學習訓練領域占據(jù)主導地位,全球眾多大型模型訓練幾乎都依賴英偉達及其生態(tài)。英偉達通過硬件與CUDA的強綁定構(gòu)建了難以撼動的生態(tài)優(yōu)勢。這種封閉性雖保障了技術一致性,卻也引發(fā)開發(fā)者不滿。ZLUDA等轉(zhuǎn)譯層項目的夭折以及英偉達明文禁止轉(zhuǎn)譯技術的強硬態(tài)度,進一步凸顯其維護壟斷地位的決心。
CANN與英偉達的競爭,本質(zhì)上是兩種生態(tài)發(fā)展邏輯的差異。開源如同“眾人拾柴”,可能加速技術普惠但需面對碎片化風險;封閉似“精耕細作”,能保證體驗統(tǒng)一卻可能形成技術霸權。當下AI行業(yè)既需要華為這類打破壟斷的嘗試,也離不開已驗證的成功經(jīng)驗。未來可能不屬于非此即彼的選擇,而在于找到開放與可控的動態(tài)平衡點。這場生態(tài)之爭的終局,將由開發(fā)者用代碼投票決定。在AI時代,最寶貴的從來不是硬件算力,而是匯聚在生態(tài)中的集體智慧。
深圳華為總部會議室里,幾位CANN架構(gòu)核心開發(fā)人員正在做最后的準備。9月19日的開源專題會議將是華為向全球開發(fā)者社區(qū)的一次正式亮相。他們知道,開源只是開始。真正的挑戰(zhàn)在于如何吸引全球開發(fā)者共同建設這個新生態(tài),如何讓CANN從“能用”變?yōu)椤昂糜谩?,從“替代選擇”變?yōu)椤笆走x平臺”。窗外,夜幕降臨,但辦公樓依然燈火通明。在這場關乎AI芯片生態(tài)未來的競爭中,沒有人愿意提前下班。
當全球科技界還在為英偉達H100的算力神話驚嘆時,華為在9月18日的全聯(lián)接大會上發(fā)布了一款名為Atlas960的超節(jié)點產(chǎn)品
2025-09-19 07:54:08華為萬卡集群挑戰(zhàn)英偉達勝算幾何7月15日,英偉達創(chuàng)始人兼CEO黃仁勛出席了第三屆中國國際供應鏈促進博覽會。這是他在2025年內(nèi)第三次訪問中國大陸。幾天前的7月9日,英偉達市值在盤中突破4萬億美元大關
2025-07-15 19:27:45媒體