微軟機(jī)房大量GPU因缺電閑置 算力被電力拖累!微軟CEO納德拉在最新播客節(jié)目中透露,公司面臨一個前所未有的困境:手上有大量GPU卻因缺電和空間不足而閑置。這些英偉達(dá)AI芯片并非因?yàn)樗懔^剩而被擱置,而是現(xiàn)有的基礎(chǔ)設(shè)施無法支撐它們運(yùn)行。主要問題在于缺乏電力以及缺少可以立即投入使用的數(shù)據(jù)中心。
去年,納德拉曾提到微軟可能仍受英偉達(dá)芯片供應(yīng)限制。如今,這個問題已成為所有大模型巨頭共同面臨的挑戰(zhàn)。奧特曼也在同期討論中指出,行業(yè)面臨的不僅是算力問題,還有能源和基礎(chǔ)設(shè)施的匹配問題。過去兩年,奧特曼投資了裂變能源公司Oklo、聚變能源公司Helion以及太陽能創(chuàng)業(yè)公司Exowatt。然而,這些新型能源技術(shù)短期內(nèi)難以大規(guī)模商用,數(shù)據(jù)中心依舊依賴燃?xì)夂涂稍偕茉椿旌瞎╇姟?/p>
過去五年,美國整體電力需求曲線因AI和云計(jì)算帶動的數(shù)據(jù)中心建設(shè)而迅速上升,遠(yuǎn)遠(yuǎn)超出公用事業(yè)公司的新增發(fā)電規(guī)劃。傳統(tǒng)電廠從立項(xiàng)到并網(wǎng)通常需要數(shù)年時間,而AI產(chǎn)業(yè)擴(kuò)張的速度以季度計(jì)算。因此,越來越多的數(shù)據(jù)中心開發(fā)商選擇采用“計(jì)量表后”供電方式,直接將電力接入數(shù)據(jù)中心,繞過公共電網(wǎng),以彌補(bǔ)供能缺口。盡管如此,數(shù)據(jù)中心、電力與冷卻系統(tǒng)的建設(shè)節(jié)奏還是跟不上現(xiàn)實(shí)需求。
光伏太陽能被視為目前建設(shè)周期最短、部署最靈活的能源形式,但其建設(shè)時間與數(shù)據(jù)中心幾乎同步,從選址、施工到并網(wǎng)動輒數(shù)月甚至一年。AI需求的變化往往只需要一次模型更新或一次產(chǎn)品發(fā)布。部分業(yè)內(nèi)人士擔(dān)心,如果未來AI需求增速放緩,當(dāng)前為支撐AI算力而大規(guī)模投資的電廠和儲能項(xiàng)目可能會出現(xiàn)閑置風(fēng)險(xiǎn)。但奧特曼認(rèn)為,AI用電需求只會持續(xù)增長,更高效、更便宜的算力會激發(fā)出更多應(yīng)用場景。他呼吁美國政府每年增加100吉瓦發(fā)電能力,并將其視為“AI戰(zhàn)略資產(chǎn)”。
微軟方面表示不會再囤積單一代GPU。昂貴的英偉達(dá)芯片如果暫時插不上電,兩三年后又被新架構(gòu)取代,就會提前貶值。根據(jù)微軟經(jīng)驗(yàn),數(shù)據(jù)中心設(shè)備折舊周期通常是六年,盲目囤貨不僅占用現(xiàn)金,還會造成資源浪費(fèi)。自20世紀(jì)90年代末以來,美國電力生產(chǎn)一直徘徊在約4萬億千瓦時/年。人口增長、物理電網(wǎng)老化及科技進(jìn)步都對電力需求提出了更高要求。GPU生產(chǎn)可以按季度迭代,但電力系統(tǒng)、數(shù)據(jù)中心冷卻與輸電網(wǎng)絡(luò)的建設(shè)卻是以年為單位的工程。AI產(chǎn)業(yè)算力增長能否延續(xù),關(guān)鍵在于能源與基礎(chǔ)設(shè)施是否能同步擴(kuò)張。
周一,微軟宣布相關(guān)部門已批準(zhǔn)其向阿聯(lián)酋運(yùn)送英偉達(dá)芯片,用于建設(shè)訓(xùn)練AI模型所需的數(shù)據(jù)中心。未來四年,微軟將在海灣國家投資80億美元用于數(shù)據(jù)中心、云計(jì)算和其他人工智能項(xiàng)目。中東地區(qū)資金豐厚且能源豐富,這筆交易標(biāo)志著AI基礎(chǔ)設(shè)施正在從硅谷遷往能源充足的新興市場。或許在那里,微軟購買的英偉達(dá)GPU可以不再吃灰。