我國AI算力以年均300%的速度增長 智能算力需求激增!當前,我國在AI時代數(shù)字經(jīng)濟發(fā)展面臨一個關(guān)鍵命題:AI算力面對日趨復(fù)雜的外部環(huán)境和內(nèi)生性效率的挑戰(zhàn),中國正積極探索更具戰(zhàn)略智慧和發(fā)展韌性的破局之路。
大模型和生成式人工智能不斷推高算力需求。據(jù)《2025年中國人工智能計算力發(fā)展評估報告》顯示,2024年,中國智能算力規(guī)模將達725.3EFLOPS,同比增長74.1%;到2025年,這一規(guī)模將增至1037.3EFLOPS,增長43%,遠高于通用算力增幅。預(yù)計2023—2028年間,中國智能算力規(guī)模的五年年復(fù)合增長率將達到46.2%。
盡管智能算力蓬勃發(fā)展,但仍存在挑戰(zhàn),主要體現(xiàn)在外部制約和內(nèi)生性效率瓶頸上。例如,目前部分依賴國外高端計算芯片,地緣政治風(fēng)險如同“達摩克利斯之劍”。此前美國對包括英偉達A100、H100及其為中國市場特供的A800、H800在內(nèi)的多款高端GPU芯片實施出口管制,這既是挑戰(zhàn),也是倒逼中國加速實現(xiàn)算力體系自主可控、探索非對稱發(fā)展路徑的契機。
內(nèi)生性效率瓶頸主要表現(xiàn)為國內(nèi)存算比失衡。國內(nèi)市場在算力與存力上的投資配比約為40:1,而國外市場通常維持在10:1以內(nèi)。這種不合理的投資比例忽視了存力作為算力效能基石的關(guān)鍵作用,導(dǎo)致GPU利用率低下。加之馮?諾依曼架構(gòu)下的“存儲墻”效應(yīng),制約了計算系統(tǒng)的整體有效帶寬和效率。
面對這些挑戰(zhàn),業(yè)內(nèi)認為發(fā)展集群算力是突破算力瓶頸的關(guān)鍵舉措。大規(guī)模智算集群正在成為業(yè)界關(guān)注的焦點?!耙跃W(wǎng)強算”和“以存提算”是業(yè)界普遍認可的兩大核心驅(qū)動力。通過存儲和計算的深度協(xié)同,解決“算力空等”問題,讓寶貴的AI計算資源發(fā)揮最大效益,已成為行業(yè)共識。
緩解“存儲墻”帶來的效率瓶頸,關(guān)鍵在于優(yōu)化傳統(tǒng)的存算分離架構(gòu),走向更深度的存算協(xié)同。業(yè)界更長遠的探索方向是“存算一體”的顛覆性架構(gòu),旨在數(shù)據(jù)在存儲器內(nèi)部就地完成計算,從根本上消除數(shù)據(jù)搬移的延遲和功耗,從而實現(xiàn)計算效率和成本的革命性突破。
近日,英偉達CEO黃仁勛參加了Bg2 Pod訪談,這是一檔聚焦科技與投資的雙周開源對話播客欄目。在訪談中,黃仁勛就AI前景和與OpenAI的合作等話題分享了自己的見解
2025-09-28 09:11:46黃仁勛看好未來全球AI資本開支增長