一周前的CES 2025上,英偉達(dá)創(chuàng)始人黃仁勛宣布Blackwell芯片已經(jīng)全面投產(chǎn),其中GB200芯片能夠?yàn)榇笳Z言模型推理負(fù)載帶來30倍的性能提升,并將成本和能耗降低25倍。然而,這份利好消息還未完全消化,一份168頁的“臨時(shí)最終規(guī)則”迅速讓市場(chǎng)情緒變得悲觀。
1月13日,白宮官網(wǎng)公布了針對(duì)人工智能的臨時(shí)最終出口管制規(guī)則,以國(guó)家安全為由進(jìn)一步限制人工智能芯片和技術(shù)的出口。媒體稱其為“人類史上首個(gè)全球AI出口管制規(guī)則”,并認(rèn)為中國(guó)的科技企業(yè)將受到?jīng)_擊。經(jīng)歷了2024年的鋪墊后,2025年注定會(huì)上演一場(chǎng)AI全球競(jìng)賽,而中國(guó)在算力上的困境亟需解決。
這份新規(guī)對(duì)AI芯片提出了全球許可要求,還對(duì)“模型權(quán)重”進(jìn)行了管制。新的禁令將全球國(guó)家和地區(qū)分為三級(jí):Tier 1的少數(shù)盟友可以不受限制地獲取AI芯片;Tier 2的國(guó)家和地區(qū)面臨總算力限制;中國(guó)大陸在內(nèi)的Tier 3國(guó)家和地區(qū)將被全面禁止進(jìn)口先進(jìn)芯片。此外,企業(yè)不能在Tier 3國(guó)家和地區(qū)部署高性能閉源模型,在Tier 2國(guó)家和地區(qū)進(jìn)行部署時(shí)必須遵守安全標(biāo)準(zhǔn)。如果需要對(duì)通用開源模型進(jìn)行微調(diào)且消耗大量算力,必須向美國(guó)政府申請(qǐng)?jiān)S可。這導(dǎo)致國(guó)內(nèi)科技企業(yè)可能進(jìn)一步面臨GPU短缺的問題,影響大模型訓(xùn)練及產(chǎn)業(yè)進(jìn)程,削弱中國(guó)AI競(jìng)爭(zhēng)力。
盡管如此,一些替代方案已經(jīng)成熟。華為副董事長(zhǎng)徐直軍提出,基于實(shí)際可獲得的芯片制造工藝,通過計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)技術(shù)協(xié)同創(chuàng)新,打造“超節(jié)點(diǎn)+集群”系統(tǒng)算力解決方案。華為云上線了昇騰AI云服務(wù),整合大規(guī)模算力集群、計(jì)算引擎CANN、AI框架MindSpore等,提供穩(wěn)定可靠的全棧算力保障。華為云的AI原生云基礎(chǔ)設(shè)施CloudMatrix通過資源池化和超高帶寬網(wǎng)絡(luò),實(shí)現(xiàn)了靈活擴(kuò)展和高效利用。