ET 09:11

谷歌TPU v7推理成本降70% 挑战英伟达AI芯片经济格局

IMP8.0
SNT+0.8
CONF90%
Operational

根据高盛2026121日发布的报告,谷歌TPU v7相比TPU v6将推理成本降低约70%,在关键成本指标上已与英伟达GB200 NVL72趋近甚至持平。这一进展标志着行业正从追求算力峰值转向可持续、低成本的AI执行模式。

高盛分析指出,TPU能效优势源于系统级集成:高带宽互连、HBM内存、台积电CoWoS封装及机架级优化。谷歌已广泛使用TPU进行Gemini模型推理,而Anthropic已向博通(AVGO-US)下单21亿美元采购未来基于TPU的系统,预计2026年中交付。尽管英伟达仍领先于生态和研发周期,AMD(AMD-US)与亚马逊(AMZN-US)在成本控制上仍显滞后。高盛维持对英伟达与博通的“买入”评级,预测未来GPU主攻训练与通用计算,定制ASIC则将在可扩展、可预测的推理场景中占据主导,AI进入‘逐token回报’时代。

EditorWong Mei Ling