Red Hat AI 3.4推理速度提升3倍
在2026年5月11日的Red Hat Summit 2026大会上,Red Hat发布了Red Hat AI 3.4版本,将AI推理速度最高提升3倍,并宣布与NVIDIA、Voyager Technologies及Nissan等公司达成新的战略合作。这一系列动作标志着Red Hat正从传统的开源软件提供商,向大规模AI推理、航天边缘计算和软件定义汽车等前沿领域深度渗透,其核心策略是帮助企业利用现有数据优化模型,而非从零构建。
推理速度最高提升3倍:推测解码与Agent管理成核心更新
Red Hat AI 3.4是此次大会的重磅发布。新版本引入了“推测解码”技术,能将推理速度最高提升至3倍。该版本还新增了模型服务能力,企业可以通过统一网关管理模型访问、追踪使用情况,并实施相关策略。此外,Agent管理和可观测性功能也得到显著增强,并新增对模型上下文协议网关和目录的支持。Red Hat AI业务副总裁Joe Fernandez表示,AI推理将成为企业场景的核心工作负载,而AI Agent的普及将进一步提升推理需求。
在生态合作方面,Red Hat与NVIDIA的合作进一步深化,新增对NVIDIA Blackwell架构和Vera Rubin平台的支持。同时,Red Hat将参与NVIDIA的OpenShell项目,用于AI Agent的沙箱和安全执行。
从国际空间站到软件定义汽车:太空与汽车领域的破圈合作
Red Hat宣布与Voyager Technologies合作,将Red Hat Enterprise Linux 10.1部署到国际空间站的航天边缘微型数据中心。该项目旨在电力和硬件资源受限的环境中实现数据就地处理,而非回传地面,并支持AI工作负载运行。这一布局显示了Red Hat在极端计算环境下的技术实力。
在汽车领域,Red Hat与日本车企Nissan合作开发下一代软件定义车辆平台。双方公布了联合工程计划,将基于Red Hat In-Vehicle Operating System展开合作。Red Hat将为Nissan的车辆计算架构提供标准化的Linux平台基础,并在车辆全生命周期内支持软件更新和AI能力部署。
核心竞争力:从基础模型到数据连接的战略转向
Joe Fernandez强调,Red Hat当前的重点是帮助企业将自身数据连接到现有模型,而不是从零开始构建基础模型。这种差异化的市场定位,结合Red Hat在开源生态中的深厚积累,使其在AI基础设施、边缘计算和车载系统等领域形成了独特的竞争优势。随着AI Agent和推理需求的持续增长,Red Hat的战略转型正加速从传统运维平台向AI原生时代的底层基础设施提供商演进。