國產(chǎn)算力破局之戰(zhàn)開打了嗎 生死較量背后的機(jī)遇與挑戰(zhàn)。全球每三個(gè)AI項(xiàng)目中,就有一個(gè)因算力不足而受阻。中國的GPU市場正以每年32%的速度增長,預(yù)計(jì)到2025年市場規(guī)模將突破1200億元。這場算力爭奪戰(zhàn)的核心是國產(chǎn)GPU與英偉達(dá)之間的競爭。
英偉達(dá)的H100芯片成本僅約3000美元,售價(jià)卻高達(dá)3萬美元,毛利率超過80%。2025年第一季度,其單季營收達(dá)到362億美元,相當(dāng)于比利時(shí)整個(gè)國家的GDP,占據(jù)全球98%的AI芯片市場份額。此外,英偉達(dá)通過CUDA生態(tài)鎖定了全球3000萬開發(fā)者,使得微軟、谷歌等巨頭即使被高價(jià)“薅羊毛”也只能繼續(xù)使用其產(chǎn)品,因?yàn)楦鼡Q芯片需要重寫代碼,成本高昂。
美國對(duì)中國的制裁反而加速了國產(chǎn)GPU的發(fā)展。2022年禁售A100,2025年H20也不再供應(yīng)中國市場。為繞過限制,中國企業(yè)通過新加坡采購,盡管價(jià)格翻倍,需求仍然旺盛。這給了國內(nèi)廠商機(jī)會(huì),摩爾線程在2025年上半年募資80億,沐曦科技融資39億,壁仞科技準(zhǔn)備在香港上市。然而繁榮背后也存在泡沫,寒武紀(jì)市盈率高達(dá)400倍,摩爾線程三年虧損50億,資本市場對(duì)國產(chǎn)GPU既有期待也有擔(dān)憂。
面對(duì)技術(shù)封鎖,中國企業(yè)采取了“算力榨取”的策略。DeepSeek開源模型使訓(xùn)練成本減半,騰訊和字節(jié)通過軟件優(yōu)化提升了國產(chǎn)GPU利用率。硬件方面,分布式架構(gòu)成為關(guān)鍵。華為昇騰的萬卡集群在訓(xùn)練精度上接近英偉達(dá)A100,性能擴(kuò)展系數(shù)超過90%。摩爾線程也將夸娥智算集群從千卡升級(jí)到萬卡,對(duì)標(biāo)國際頂尖水平。
過去,中國廠商使用進(jìn)口GPU只能獲得10%至20%的利潤。如今,景嘉微的JM5400芯片實(shí)現(xiàn)了高性能GPU零的突破,中芯國際的7nm工藝支持了芯片量產(chǎn)。國產(chǎn)化后,利潤分配反轉(zhuǎn),70%至80%留在國內(nèi)。政策支持下,2025年國資智算中心必須100%自主可控,為國產(chǎn)GPU提供了穩(wěn)定市場。摩爾線程的MUSA架構(gòu)試圖打破CUDA壟斷,雖然目前還較弱小,但有潛力發(fā)展壯大。
不過,國產(chǎn)GPU仍面臨挑戰(zhàn)。英偉達(dá)的Blackwell架構(gòu)領(lǐng)先三代,而國產(chǎn)芯片還在追趕。光刻機(jī)和EDA工具受限,ASML的EUV光刻機(jī)無法進(jìn)入中國,導(dǎo)致7nm以下工藝難以實(shí)現(xiàn)。資本市場的過熱也令人擔(dān)憂,科創(chuàng)板未盈利企業(yè)IPO占比超過70%,寒武紀(jì)的高估值能否持續(xù)是個(gè)問題。另外,美國開始關(guān)注HBM顯存,這可能成為新的瓶頸。
短期內(nèi),異構(gòu)計(jì)算和軟件優(yōu)化是填補(bǔ)算力缺口的關(guān)鍵。通過混搭不同架構(gòu)的芯片和算法優(yōu)化,中國企業(yè)正在嘗試彎道超車。長期來看,RISCV架構(gòu)構(gòu)建自主生態(tài)是重要方向。英偉達(dá)宣布將CUDA移植到RISCV,為中國提供了一個(gè)機(jī)會(huì),如果能抓住這個(gè)機(jī)遇,五年內(nèi)將全球市占率提升到30%并非不可能。
當(dāng)中國企業(yè)能夠以十分之一的成本實(shí)現(xiàn)同等算力時(shí),英偉達(dá)的“AI稅”帝國還能維持多久?這場算力戰(zhàn)爭的結(jié)局或許就在國產(chǎn)GPU的每一次迭代中逐漸顯現(xiàn)。