Kexin

Kexin
英伟达向AI巨头交付首批Vera CPU

Latest

英伟达向AI巨头交付首批Vera CPU

Nvidia本周正式向Anthropic、OpenAI、SpaceXAI及Oracle Cloud Infrastructure交付首批Vera CPU,标志着其为Agentic AI量身定制的首款数据中心处理器进入量产阶段。Vera采用88颗自研Olympus核心,内存带宽达1.2 TB/s,单核性能较前代Grace提升50%,成为AI推理与智能体工作负载的专用基础设施。Nvidia副总裁Ian Buck亲自完成四家客户的交付仪式,Oracle更宣布计划自2026年起部署数十万颗Vera CPU,预示着一个专为“AI工厂”设计的CPU时代正式开启。 首批交付覆盖四大AI巨头:Anthropic与OpenAI现场签收 交付行动于上周五及本周一展开。Ian Buck首先抵达Anthropic位于SoMa区的办公室,计算负责人James Bradbury接收服务器后表示:“计算规模的扩展是模型增长的重要加速器,Vera在解决Agentic工作负载时将成为生态系统中一个有前途的组成部分。”随后在OpenAI Mission Bay总部,计算基础设施负责人Sachin Katti亲自感谢

By Kexin
NTT DATA收购WinWire加码Agentic AI

Latest

NTT DATA收购WinWire加码Agentic AI

日本IT服务巨头NTT DATA宣布收购专注于自主智能体AI(Agentic AI)与微软Azure企业转型的合作伙伴WinWire,将逾千名Azure工程师和AI专家纳入旗下。此次交易标志着企业AI市场从实验性聊天机器人向集成化运营系统转型的关键节点——WinWire在“Agentic AI”成为热词前已深耕微软企业云堆栈多年,其“规模化Agentic AI”框架被视为行业从孤立Demo跨入生产级部署的核心能力。 WinWire:被收购前已是Agentic AI的先行者 不同于在生成式AI热潮中涌现的咨询公司,WinWire在“Agentic AI”成为主流术语之前已围绕微软企业云堆栈构建业务。该公司提出了“Agentic AI @ Scale”框架,专注于部署能在受控环境中推理、采取行动并与企业基础设施交互的AI系统。其核心聚焦点并非聊天界面或Copilot,而是将AI智能体直接嵌入运营系统和业务工作流程中。这种能力在企业试图从实验转向自动化关键业务流程时变得至关重要。 WinWire在Microsoft Fabric、Azure AI Foundry、数据现代化以及面向企

By Kexin
OpenAI整合产品线押注AI Agent

Latest

OpenAI整合产品线押注AI Agent

在冲刺IPO的关键节点,OpenAI突然掀起一场“自我革命”:将ChatGPT、Codex与API三大产品线彻底打碎重组,并由联合创始人Greg Brockman亲自操盘产品战略。这一动作背后,是公司面临高管持续流失、周活用户增长触及天花板、以及前员工创立的Anthropic估值飙升至9000亿美元反超的多重压力。OpenAI能否凭借这一“背水一战”重新夺回全球AI独角兽的王座,市场正屏息以待。 Greg Brockman全面掌权,产品线整合进入Agent时代 据外媒《WIRED》报道,OpenAI联合创始人兼总裁Greg Brockman正式接管产品战略,同时继续负责AI基础设施。此前,他曾临时在消费者产品负责人Fidji Simo休假期间掌管产品线,如今这一任命已正式生效。Brockman曾在Stripe担任CTO,拥有深厚的底层架构经验。与此同时,ChatGPT自上线以来的负责人Nick Turley被调任企业用户业务,接替他的是前Instagram副总裁Ashley Alexander。 Brockman在内部备忘录中解释了合并产品线的目的:“以最大的专注力向Agent

By Kexin
银行云运营决策:适应代理AI或落后

CxO

银行云运营决策:适应代理AI或落后

银行云运维正站在一个关键的十字路口。面对日益复杂、强监管且高度互联的混合多云环境,传统的脚本化自动化和人力协调已力不从心。Amdocs 委托 Coleman Parkes 进行的最新研究揭示了银行业的一项关键转折:截至 2025 年底,已有 28% 的银行在生产环境中运行 AI 代理(Agentic AI)进行云运维,这一比例预计到 2026 年底将飙升至 71%。更引人注目的是,在完成概念验证的银行中,97% 已迅速进入全面投产阶段。这表明,Agentic AI 不再只是技术试验,而是正在重塑银行核心运维竞争力的战略武器。那些未能及时拥抱这一趋势的机构,正面临被新兴数字银行和先行者拉开代差的真实风险。 数据揭示:Agentic AI 采用率飙升,早期试点纷纷落地 Amdocs 的研究数据清晰地描绘了 Agentic AI 在银行云运维领域的爆发轨迹。2025 年末,仅有略超四分之一的银行将其投入生产;但到 2026

By Kexin
代理AI驱动应用材料利润新高

Latest

代理AI驱动应用材料利润新高

全球半导体设备巨头Applied Materials在2026财年第二季度交出了一份令人瞩目的成绩单:营收与利润双双创下历史新高,并录得25年来最高利润率。这一强劲表现背后,是“代理式人工智能”(agentic AI)正在推动全球AI基础设施建设的持续扩张,从而引爆了对先进芯片制造设备的旺盛需求。作为芯片制造工具领域的风向标,Applied Materials的业绩再次印证了AI对半导体产业的深远影响。 根据公司发布的财报,Applied Materials在2026财年第二季度的各项关键财务指标均超出市场预期。尤其值得关注的是,其利润率达到了过去25年来的最高水平,这主要得益于面向先进逻辑、DRAM和高带宽存储器(HBM)领域的设备出货量激增。公司管理层在电话会议中指出,随着企业级AI应用从训练转向推理,以及“代理式AI”模型对计算和存储资源的巨大需求,晶圆厂产能的建设步伐正在全面加快,这直接转化为对Applied Materials刻蚀、沉积和计量设备的庞大订单。 值得注意的是,AI芯片支出的持续增长正在接近1万亿美元的临界点,这为设备市场提供了强劲的长期动力。Applied

By Kexin
博士八十小时科研 智能体两小时完成

Deep

博士八十小时科研 智能体两小时完成

在人工智能领域,一项由前Amp Code工程师Dan McAteer进行的实验引发广泛关注:利用OpenAI Codex的“目标模式”(Goal Mode),一个机械可解释性研究任务在1小时56分钟内完成,而GPT-5.5自身估算博士完成类似任务需约80小时,效率差距达40倍。这一赛博朋克式的对比,不仅刷新了人们对AI科研能力的认知,更揭示了“递归自我改进”的奇点正以前所未有的速度靠近——全行业或许已在不知不觉中迈过了AGI的门槛。 40倍效率背后:Codex /goal 模式让AI从“听指令”变“出策略” McAteer的实验配置极为精简:使用OpenAI Codex的/goal命令、GPT-5.5高精度模型和快速模式。据OpenAI Codex工程师Philip Corey介绍,/goal是对“Ralph loop”的实现——目标在多轮对话中持续存在,不达成不停止。传统Codex调用需要逐句下指令,而/goal模式只需给出一个目标,AI便能自主拆分子任务、执行、审查、迭代,直至完成或失败。这种从对话式AI到目标驱动AI的工程跃迁,

By Kexin
Insider One收购Bluecore扩展自主AI平台

Latest

Insider One收购Bluecore扩展自主AI平台

自主客户互动平台 Insider One 近日宣布收购零售营销技术提供商 Bluecore。后者服务于超过 400 家大型零售品牌,包括 ALO Yoga、J.Crew、丝芙兰、Bloomingdale’s、The North Face、Ralph Lauren 等。此次交易未公开财务条款。收购的核心目的在于强化 Insider One 在自主式客户互动领域的竞争壁垒,通过整合 Bluecore 的购物者身份识别技术与行为数据平台,进一步提升其面向大型企业的 AI 驱动、端到端客户互动能力。 收购 Bluecore:强化零售数据基础设施与身份识别技术 Insider One 表示,其平台集成了原生客户数据平台、跨渠道旅程编排、个性化技术以及能够自主管理客户互动工作流的 AI 智能体。公司声称,其闭环架构持续吸收客户交互数据,允许 AI 系统实时在超过

By Kexin

你的AI智能体不应看到所有工具

在代理式人工智能(Agentic AI)领域,一个反直觉的发现正在颠覆现有的设计范式:智能体之所以表现不佳,往往不是因为它知道的太少,而是因为它“看见”了太多工具。DPO的最新研究指出,当前主流的全量工具注入提示词(Prompt)的方式,正成为制约AI代理性能的核心瓶颈。一种名为“技能检索增强”(Skill Retrieval Augmentation)的新方法,试图通过将技能库移出提示词窗口,仅在任务执行时检索所需片段,来破解这一困局。然而,这一策略同时将“能力选择”本身推向了下一代代理式AI的前沿挑战。 传统的代理系统在设计时,通常将所有可调用工具的函数定义、API描述和技能规则直接嵌入到大型语言模型(LLM)的上下文窗口中。这种做法在工具数量较少时尚可运作,但随着企业级代理需要维护成百上千个微技能,提示词迅速膨胀,导致模型注意力分散、推理精度下降,甚至出现“工具幻觉”——智能体在无关工具中选取错误的操作。DPO提出的“技能检索增强”(SRA)框架,借鉴了检索增强生成(RAG)的成功经验,将技能和工具的存储与调用解耦。在运行时,

By Kexin
AI智能体提升生产力,引发行业焦虑

Insights

AI智能体提升生产力,引发行业焦虑

在硅谷,衡量科技公司实力的新标准不再是员工规模,而是AI代理的数量。随着AI代理能力的飞跃式发展,这些程序正从聊天机器人演变为能自主执行任务的工具,如预订航班或清理垃圾邮件,从而显著提升生产力。然而,这种进步也引发了行业内的“代币焦虑”,员工们担心若不利用AI实现10倍效率提升,就会被淘汰。从初创企业到科技巨头,人们纷纷投入AI代理的自动化浪潮,但随之而来的是身份危机和压力,促使一些高管重新思考工作的本质。 AI代理的崛起与自动化实践 过去六个月,AI代理能力取得重大突破,例如Anthropic的Claude Code和OpenAI的Codex专注于软件开发,而OpenClaw等工具允许用户通过手机消息控制代理,实现24/7自主工作。尽管结果有时不可预测,但科技从业者已开始大规模部署这些工具。John Huang,一位科技行业资深人士,运行着自己的初创投资网络,目前使用八个AI代理自动化日常任务,如从Reddit收集新闻和更新简历。他不再雇佣人类助理,转而支付AI代币费用,这反映了成本效益的转变。 行业焦虑与“代币最大化”现象 硅谷的竞争压力催生了“代币焦虑”,即员工担心若

By Kexin
OpenCloudOS启动AI容器共建计划

Events

OpenCloudOS启动AI容器共建计划

在大模型和 Agent 技术飞速迭代的当下,底层系统的适配往往成为制约部署效率的关键瓶颈。许多在本地环境中顺畅运行的 AI 工具,如 vLLM 和 Dify,一旦迁移至国产生产环境,便常遭遇依赖冲突和镜像缺失的挑战,导致部署过程从“开箱即用”退化为“从零造轮子”。为铺平这“最后一公里”,由腾讯及多家厂商发起的开源操作系统 OpenCloudOS(OC)联合 InfoQ 推出了“Agentic AI 容器计划”,旨在通过开发者共建,推动主流 AI 框架与 Agent 在 OC 上实现开箱即用,扫清适配障碍。 活动概览与任务范围 “Agentic AI 容器计划”作为 OC 2026 年开发者共建计划的首站,覆盖六大方向,包括 Hermes、LangChain、vLLM、

By Kexin
Ammune.AI推出首款AI代理运行时安全平台

Startups

Ammune.AI推出首款AI代理运行时安全平台

随着企业加速采用 AI 代理来自动化工作流程、交互服务和决策制定,这些代理越来越多地通过 API 运行,往往缺乏集中化的可见性或控制。这一转变引入了新的安全风险类别,即 AI 驱动的活动可能访问敏感数据、触发业务逻辑,并在不被察觉的情况下扩大滥用。传统安全解决方案对此束手无策,因为它们主要关注 AI 模型、提示或应用代码的安全,却忽视了 AI 代理在运行时跨 API 的行为——这正是关键业务操作发生的地方。Ammune.AI 作为受监管企业 API 安全领域的领导者,今日宣布推出其 AI 代理运行时安全平台,这是首个旨在实时发现、映射和保护跨企业系统运行的自主 AI 代理的解决方案,为高度监管的行业如银行、政府和关键基础设施提供实时可见性、行为分析和自主保护,包括完全隔离的环境。 核心功能与创新 Ammune.AI 的 AI 代理运行时安全平台引入了一个新类别,专注于运行时行为跨系统,提供统一视图以了解 AI

By Kexin