Latest
谷歌发布两款TPU,拆分训练与推理芯片
在AI推理需求爆发和智能体规模化部署的背景下,谷歌云于年度开发者大会上宣布重大战略转向,推出两款第八代TPU芯片——专为训练优化的TPU 8T和面向推理场景的TPU 8i,首次将训练与推理任务拆分至独立芯片。此举旨在降低推理成本、提升能效比,并支撑企业AI智能体的全面铺开。同时,谷歌发布Gemini企业级智能体平台,补齐记忆与协作短板,直指OpenAI和Anthropic在企业市场的竞争格局。这一硬件与软件的双线出击,标志着谷歌正以算力重构和应用层卡位,正面冲击英伟达主导的AI芯片市场。 训练与推理分离,芯片性能大幅跃升 谷歌将第八代TPU拆分为两款独立产品,是对AI工作负载分化趋势的直接回应。TPU 8T专为AI模型训练优化,号称能将前沿模型开发周期从数月压缩至数周,每瓦性能较上一代提升124%,在同等价格下性能比第七代TPU提升2.8倍。TPU 8i则面向推理场景,每瓦性能提升117%,性能比上一代提升80%,集成384MB的SRAM,是上一代的三倍,以减少数据外部调取,支持多步骤推理任务。两款芯片均计划于2026年晚些时候上市,旨在以成本效益方式提供大规模吞吐量和低延迟。