Latest

谷歌发布两款TPU，拆分训练与推理芯片

admin

10 May 2026 — 3 min read

在AI推理需求爆发和智能体规模化部署的背景下，谷歌云于年度开发者大会上宣布重大战略转向，推出两款第八代TPU芯片——专为训练优化的TPU 8T和面向推理场景的TPU 8i，首次将训练与推理任务拆分至独立芯片。此举旨在降低推理成本、提升能效比，并支撑企业AI智能体的全面铺开。同时，谷歌发布Gemini企业级智能体平台，补齐记忆与协作短板，直指OpenAI和Anthropic在企业市场的竞争格局。这一硬件与软件的双线出击，标志着谷歌正以算力重构和应用层卡位，正面冲击英伟达主导的AI芯片市场。

训练与推理分离，芯片性能大幅跃升

谷歌将第八代TPU拆分为两款独立产品，是对AI工作负载分化趋势的直接回应。TPU 8T专为AI模型训练优化，号称能将前沿模型开发周期从数月压缩至数周，每瓦性能较上一代提升124%，在同等价格下性能比第七代TPU提升2.8倍。TPU 8i则面向推理场景，每瓦性能提升117%，性能比上一代提升80%，集成384MB的SRAM，是上一代的三倍，以减少数据外部调取，支持多步骤推理任务。两款芯片均计划于2026年晚些时候上市，旨在以成本效益方式提供大规模吞吐量和低延迟。

AI智能体平台全面铺开，直指OpenAI与Anthropic

在软件层面，谷歌推出Gemini Enterprise Agent Platform，新增Memory Bank和Memory Profile功能以弥补AI工具的记忆短板，并整合协作平台Projects，为智能体提供上下文支持。此外，面向普通员工的Gemini Enterprise应用允许用户无需编码即可创建智能体。这一系列工具旨在挑战OpenAI和Anthropic在企业市场的布局，回应硅谷工程师在AI编程工具上对谷歌的忽视。

TPU采用加速，英伟达合作并行推进

尽管谷歌加码自研芯片，但与英伟达的合作持续，计划成为英伟达新一代芯片的首批部署方。TPU商业采用正在提速，包括Citadel Securities、美国能源部实验室、Meta和Anthropic等客户的使用。DA Davidson分析师估计TPU业务与DeepMind合计价值约9000亿美元。谷歌未将新芯片与英伟达产品直接对比，但正测试将TPU部署至客户数据中心，以扩大可及性，同时应对供应瓶颈和开发周期错位等挑战。

谷歌发布两款TPU，拆分训练与推理芯片

admin

训练与推理分离，芯片性能大幅跃升

AI智能体平台全面铺开，直指OpenAI与Anthropic

TPU采用加速，英伟达合作并行推进

Read more

阿里免费高考志愿Agent上线

科大讯飞发布SpaceMind

GitHub和Hugging Face创始人注资AI代理初创Zaro

代理AI引爆700亿安全市场重塑