英伟达向AI巨头交付首批Vera CPU
Nvidia本周正式向Anthropic、OpenAI、SpaceXAI及Oracle Cloud Infrastructure交付首批Vera CPU,标志着其为Agentic AI量身定制的首款数据中心处理器进入量产阶段。Vera采用88颗自研Olympus核心,内存带宽达1.2 TB/s,单核性能较前代Grace提升50%,成为AI推理与智能体工作负载的专用基础设施。Nvidia副总裁Ian Buck亲自完成四家客户的交付仪式,Oracle更宣布计划自2026年起部署数十万颗Vera CPU,预示着一个专为“AI工厂”设计的CPU时代正式开启。
首批交付覆盖四大AI巨头:Anthropic与OpenAI现场签收
交付行动于上周五及本周一展开。Ian Buck首先抵达Anthropic位于SoMa区的办公室,计算负责人James Bradbury接收服务器后表示:“计算规模的扩展是模型增长的重要加速器,Vera在解决Agentic工作负载时将成为生态系统中一个有前途的组成部分。”随后在OpenAI Mission Bay总部,计算基础设施负责人Sachin Katti亲自感谢Nvidia,Buck甚至现场用螺丝刀打开机箱展示内部结构。SpaceXAI帕洛阿尔托办公室则由Elon Musk本人签收,他详细询问了核心数量、内存布局及散热方案,公司正评估Vera在强化学习与智能体仿真管道的表现。最后,Oracle AI客户卓越中心的Karan Batta表示,Oracle计划于2026年部署数十万颗Vera CPU,以应对Agentic AI对大规模持续性能的需求。
Vera技术规格:88核心+LPDDR5X,开辟数十亿美元新业务
Vera CPU是Nvidia首款定制数据中心CPU,采用下一代定制Arm架构(Olympus),配备88核心、176线程(支持空间多线程技术),内存带宽达1.2 TB/s(基于SOCAMM LPDDR5X),系统内存1.5 TB(为Grace的3倍)。它支持1.8 TB/s NVLink-C2C一致性互连和机架级机密计算,数据处理及CI/CD性能较Grace提升约2倍。除独立服务器(LPX)外,Vera将作为Vera Rubin NVL72机架的主机处理器,与Rubin GPU共享统一内存架构,能效为传统基础设施的2倍。Nvidia预计,独立CPU出货将为其开辟另一个数十亿美元规模的新业务领域。公司强调,随着AI模型从回答问题转向生成代码等智能体操作,CPU需求正在飙升,Vera正是为保持这种规模化工作持续运行而设计的。
Agentic AI时代“CPU时刻”:Vera如何重塑AI工厂计算范式
Ian Buck将此次交付称为“Agentic AI在AI工厂中缔造的新CPU时刻”。他指出,当AI模型被提问时,答案往往需即时生成Python代码,导致CPU需求激增。Vera通过极高单线程性能、极高数据输出能力及采用LPDDR5X内存实现的能效优势,专为高吞吐推理工作负载设计。它同时与Rubin GPU、BlueField 4 DPU、Spectrum-X及MGX机架架构形成极致协同设计。随着Vera进入全面量产,Vera Rubin平台预计本周后半段发布,首批机架大规模生产即将开始。这一系列动作表明,Nvidia正试图将CPU重新定义为大规模AI部署的关键环节,而非仅作为GPU的附属组件。