谷歌发布两款TPU,拆分训练与推理芯片
在AI推理需求爆发和智能体规模化部署的背景下,谷歌云于年度开发者大会上宣布重大战略转向,推出两款第八代TPU芯片——专为训练优化的TPU 8T和面向推理场景的TPU 8i,首次将训练与推理任务拆分至独立芯片。此举旨在降低推理成本、提升能效比,并支撑企业AI智能体的全面铺开。同时,谷歌发布Gemini企业级智能体平台,补齐记忆与协作短板,直指OpenAI和Anthropic在企业市场的竞争格局。这一硬件与软件的双线出击,标志着谷歌正以算力重构和应用层卡位,正面冲击英伟达主导的AI芯片市场。
训练与推理分离,芯片性能大幅跃升
谷歌将第八代TPU拆分为两款独立产品,是对AI工作负载分化趋势的直接回应。TPU 8T专为AI模型训练优化,号称能将前沿模型开发周期从数月压缩至数周,每瓦性能较上一代提升124%,在同等价格下性能比第七代TPU提升2.8倍。TPU 8i则面向推理场景,每瓦性能提升117%,性能比上一代提升80%,集成384MB的SRAM,是上一代的三倍,以减少数据外部调取,支持多步骤推理任务。两款芯片均计划于2026年晚些时候上市,旨在以成本效益方式提供大规模吞吐量和低延迟。
AI智能体平台全面铺开,直指OpenAI与Anthropic
在软件层面,谷歌推出Gemini Enterprise Agent Platform,新增Memory Bank和Memory Profile功能以弥补AI工具的记忆短板,并整合协作平台Projects,为智能体提供上下文支持。此外,面向普通员工的Gemini Enterprise应用允许用户无需编码即可创建智能体。这一系列工具旨在挑战OpenAI和Anthropic在企业市场的布局,回应硅谷工程师在AI编程工具上对谷歌的忽视。
TPU采用加速,英伟达合作并行推进
尽管谷歌加码自研芯片,但与英伟达的合作持续,计划成为英伟达新一代芯片的首批部署方。TPU商业采用正在提速,包括Citadel Securities、美国能源部实验室、Meta和Anthropic等客户的使用。DA Davidson分析师估计TPU业务与DeepMind合计价值约9000亿美元。谷歌未将新芯片与英伟达产品直接对比,但正测试将TPU部署至客户数据中心,以扩大可及性,同时应对供应瓶颈和开发周期错位等挑战。