2025年的AI芯片市場正處于微妙的轉折點。英偉達憑借Blackwell在技術和市場份額上保持領先,但谷歌TPU的全面商業(yè)化開始動搖其定價權。據(jù)SemiAnalysis測算,OpenAI僅憑“威脅購買TPU”就迫使英偉達生態(tài)鏈做出了實質性讓步,使計算集群總擁有成本下降約30%。

隨著Anthropic采購高達1GW的TPU細節(jié)曝光,谷歌轉型為直接向外部出售高性能芯片與系統(tǒng)的“商用芯片供應商”。當OpenAI可以用“威脅購買TPU”換取折扣,當Anthropic用TPU訓練出超越GPT-4的模型,當谷歌愿意開放軟件生態(tài)并提供金融杠桿時,英偉達高達75%的毛利率神話變得不再牢不可破。

長期以來,谷歌的TPU像其搜索算法一樣,是深藏不露的內部核武器。但這一策略已發(fā)生根本性逆轉。最直接的案例來自Anthropic。作為能在前沿模型上媲美OpenAI的大模型公司,Anthropic已確認將部署超過100萬顆TPU。這筆交易揭示了谷歌“混合銷售”的新模式:首批約40萬顆最新的TPUv7由博通直接出售給Anthropic,價值約100億美元;剩余60萬顆通過谷歌云租賃,涉及高達420億美元的剩余履約義務。

面對這一攻勢,英偉達展現(xiàn)出防御姿態(tài),財務團隊不得不針對“循環(huán)經濟”的質疑發(fā)布長文辯解。客戶倒戈的理由很純粹:在AI軍備競賽中,性能是入場券,但總擁有成本(TCO)決定生死。SemiAnalysis數(shù)據(jù)顯示,谷歌TPUv7在成本效率上對英偉達構成碾壓優(yōu)勢。從谷歌內部視角看,TPUv7服務器的TCO比英偉達GB200服務器低約44%。即便加上谷歌和博通的利潤,Anthropic通過GCP使用TPU的TCO仍比購買GB200低約30%。

這種成本優(yōu)勢源于谷歌獨特的金融工程創(chuàng)新——“超級云廠商兜底”。谷歌承諾,如果中間商無法支付租金,谷歌將介入兜底。這一金融工具打通了加密貨幣礦工與AI算力需求之間的堵點,構建了一個獨立于英偉達體系之外的低成本基礎設施生態(tài)。

如果說價格戰(zhàn)是戰(zhàn)術層面的對壘,那么系統(tǒng)工程則是谷歌戰(zhàn)略層面的護城河。雖然單顆TPUv7在理論峰值算力上略遜于英偉達的Blackwell,但谷歌通過極致的系統(tǒng)設計抹平了差距。更重要的是,它采用了更務實的設計哲學——不追求不可持續(xù)的峰值頻率,而是通過更高的模型算力利用率提升實際產出。

谷歌的殺手锏是其獨步天下的光互連技術。不同于英偉達依賴昂貴的NVLink和InfiniBand/Ethernet交換機,谷歌利用自研的光路交換機和3D Torus拓撲結構,構建了名為ICI的片間互連網絡。這一架構允許單個TPUv7集群擴展至9,216顆芯片,遠超英偉達常見的64或72卡集群。這意味著如果某部分芯片故障,網絡可以毫秒級繞過故障點,重新“切片”成完整的3D環(huán)面,極大地提升了集群的可用性。

長期以來,阻礙外部客戶采用TPU的最大障礙是軟件。但在巨大的商業(yè)利益面前,谷歌終于放下了傲慢。SemiAnalysis報告指出,谷歌軟件團隊的KPI已從“服務內部”轉向“擁抱開源”。此前,谷歌宣布將全力支持PyTorch Native在TPU上的運行。谷歌不再依賴低效的Lazy Tensor轉換,而是通過XLA編譯器直接對接PyTorch的Eager Execution模式。這使得Meta等習慣使用PyTorch的客戶可以幾乎無縫地將代碼遷移到TPU上。

同時,谷歌開始向vLLM和SGLang等開源推理框架大量貢獻代碼,打通了TPU在開源推理生態(tài)中的任督二脈。這一轉變意味著英偉達最堅固的“CUDA護城河”,正在被谷歌用“兼容性”填平。

這場“硅谷王座”的爭奪戰(zhàn)才剛剛開始。


過去三年,英偉達憑借其在AI訓練芯片市場的壟斷地位,占據(jù)了全球80%以上的市場份額,市值一度突破5萬億美元,成為資本市場的寵兒。然而,最近一個月市場風向開始變化
2025-11-28 10:16:52一覺醒來英偉達近期被傳暫停H20芯片生產。8月21日,科技媒體《the Information》援引知情人士消息表示,英偉達已指示包括韓國三星電子、美國安靠科技等關鍵零部件供應商暫停與H20芯片相關的生產
2025-08-22 13:47:40曝英偉達暫停生產H20芯片