Latest

结构性转变：代理AI工作负载将超对话AI

Muhuai

23 May 2026 — 5 min read

新加坡人工智能API聚合平台AI.cc近日发布市场预测报告，基于平台在2026年1月至4月间处理的24亿次API调用数据，揭示出企业级AI工作负载正经历一场结构性转变：以目标驱动、自主执行、多工具调用为特征的代理型AI（Agentic AI）工作负载，预计将在2026年第三季度超越传统对话型AI（Conversational AI），成为企业Token消耗的主导类别。这一转折不仅代表着用量比例的变化，更意味着企业对AI基础设施的架构逻辑、采购策略和优化方向都必须重新定义。

数据实证：代理型API调用年增速680%，对话型仅94%

AI.cc平台统计了超过8000个开发者与企业账户的API调用行为。数据显示，2026年第一季度，代理模式API调用（定义为包含多轮上下文积累、工具调用及自我纠错循环的序列化请求）年化增长率达到680%，而单轮对话型工作负载的年化增长率仅为94%。按此趋势推算，到2026年9月，代理型工作负载将占据平台企业Token用量的54%，首次突破50%阈值；到第四季度将进一步升至61%。

这一判断基于严格的分类框架：凡具备单会话内超过5轮上下文积累、工具调用（函数、外部API、代码执行或文件操作）、以及模型对自身输出进行迭代修正三个特征的请求，被归类为“代理模式”；具备其中一到两个特征的为“半代理模式”；其余为“对话模式”。2026年第一季度，对话模式占企业Token用量的51%（去年同期为79%），半代理模式占26%（去年同期14%），代理模式占23%（去年同期7%）。

为何代理型工作负载消耗不成比例的Token量

代理型任务每个完成项的中位Token消耗量是对话型任务的23.4倍。这源于四个结构特性：链式推理Token用于任务分解和规划（占30-40%总消耗）；工具调用格式化与结果处理（每次500-2000额外Token）；错误处理与自我纠错循环（高质量代理为此消耗更多Token但产出更可靠）；长任务中上下文窗口可累积至5万-20万Token，远高于对话型的1-2万。因此，即便代理型绝对请求数较低，其Token消耗量却迅速接近并超越对话型。

这一乘数效应解释了为什么23%的请求占比就对应了日益增长的Token份额，也意味着企业预算管理者必须重新评估成本模型——对话时代按查询计价的思路已不适用，代理时代的成本与任务复杂度、步骤数量、模型选择强相关。

基础设施断层：对话时代的单模型架构无法支撑代理型负载

代理型工作负载对基础设施提出了根本不同的要求。首先，单模型架构在代理场景下要么支付过高成本用于不需要的能力，要么在关键步骤上质量不足——例如一个自主软件开发代理需要不同模型处理架构决策（前沿推理模型）、代码生成（快速中型模型）、语义搜索（专用嵌入模型）和测试路由（廉价分类模型）。其次，代理型部署的API调用量可达每天500万至2000万次，单一提供商的速率限制成为瓶颈，而多模型基础设施可通过跨提供商负载分布规避这一限制。再者，500毫秒的API延迟在200步代理工作流中累积为100秒纯等待时间，直接决定了代理能否替代人类工作流。最后，调试代理故障需要追踪数百次API调用、工具调用和中间推理步骤，要求每步日志、延迟归因、错误分类和工作流级别成本追踪，这是对话时代完全不需要的。

AI.cc的平台数据恰好印证了这一点：运行代理型工作负载的企业平均每个工作流使用6.3个不同模型，接近平台整体平均值4.7的两倍，表明代理型负载正是多模型采纳的主要驱动力。同时，AI.cc的OpenClaw框架将生产级多模型代理编排所需的工程投资压缩60-70%，包括路由逻辑、回退处理、上下文管理和成本监控等能力。

从行业分布看，软件开发和工程自动化领域代理型工作负载占比已达61%（1Q26），领先所有行业；法律和专业服务为48%；金融服务44%；电商零售39%。AI.cc建议企业AI团队立即审计当前API架构的代理就绪度、在规模爆发前实施多模型路由、投资代理可观测性基础设施，并试用OpenClaw或同类代理编排框架。

阿里免费高考志愿Agent上线

2026年高考落下帷幕，志愿填报这一决定考生命运的关键环节，正在被AI Agent技术彻底重塑。面对1290万考生、近3000所高校与2000多个专业构成的庞大选择迷宫，传统的被动式问答Chatbot已显力不从心。阿里巴巴旗下的千问近日宣布，推出国内首个全周期高考志愿填报Agent，并面向全国考生免费开放。这款产品不仅能够主动规划、持久记忆用户偏好，更通过40万“AI考生”的对抗压测，将志愿规划师的专业经验沉淀进了模型底层。从知识库构筑、对抗强化学习到动态方案生成，千问正试图用AI弥合长期存在的高考信息鸿沟，让每一位考生都能享受公平而专业的选择权。 Agent入场：从“被动应答”到“主动规划”的范式革命千问高考志愿Agent的上线，标志着AI在复杂决策场景中的进化。与聊天机器人不同，Agent具备三大核心能力：持久记忆，能记住用户说过的每一句话；主动规划，如自动生成“志愿日历”提醒关键时间节点；实时工具调用与反思，让回答更加精准。以北京一位660分、理化生选科、目标人工智能专业的考生为例，Agent在接收填写的省份、成绩、专业偏好乃至MBTI性格类型后，自动生成包含院校推荐、专

科大讯飞发布SpaceMind

2026年6月10日，科大讯飞在其英文名iFLYTEK于香港举办的全球发布会上，正式推出智慧空间Agentic架构SpaceMind。这一架构标志着人工智能Agent从虚拟数字世界加速迈入物理空间，赋予楼宇、家居等实体环境以自主思考、真实记忆与自学习能力。SpaceMind通过60GHz毫米波雷达实现5厘米级精准定位，并采用双模型协同架构将设备指令响应速度压缩至700毫秒以内，能够实时感知用户需求与环境变化，主动联动各类设备提供个性化服务。此举不仅巩固了科大讯飞在AI软硬一体战略中的技术护城河，也为智慧空间行业树立了新的交互基准。 60GHz毫米波雷达与双模型协同：重新定义空间感知精度 SpaceMind的核心技术突破在于其感知层与决策层的协同设计。根据发布会披露，该架构搭载60GHz毫米波雷达，能够实现5厘米级的室内定位精度，远超传统蓝牙或Wi-Fi方案的米级误差。在决策层面，双模型协同架构将设备指令的响应速度提升至700毫秒以内，这意味着用户在物理空间中的一举一动——从走进房间到语音指令发出——系统均能在亚秒级内完成感知、理解与设备联动。这种低延迟、高精度的交互能力，使Spa

GitHub和Hugging Face创始人注资AI代理初创Zaro

总部位于伦敦的初创公司Zaro成功完成510万美元融资，由知名风投Cherry Ventures领投，并罕见地获得了代码托管巨头GitHub联合创始人Thomas Dohmke与开源AI平台Hugging Face联合创始人Thomas Wolf的个人背书。这笔投资不仅点燃了AI Agent（智能体）赛道的新热度，更揭示了行业正在从“通用聊天机器人”加速迈向“定制化数字劳动力”的关键拐点。硅谷传奇创始人押注，企业级AI Agent从“演示”到“部署” Zaro的创始团队由Tommy Barav领导，他此前是AI初创公司Lovable（原名GPT Engineer）的增长顾问。该公司提供的核心服务是帮助客户构建定制化的AI Agent，其目标市场直指企业自动化中尚未被完全开发的“灰色地带”。据Zaro透露，其技术栈能够将AI Agent从单纯的对话工具升级为能够独立执行复杂业务流程的“虚拟员工”。本次融资的投资者阵容星光熠熠，GitHub的Dohmke和Hugging Face的Wolf以“天使投资人”身份加入，此外还有Spotify早期高管Petter Carlsson和马士基

代理AI引爆700亿安全市场重塑

全球网络安全市场在2026年第一季度突破70亿美元大关，同比增长14%，这一稳健增长背后隐藏着更深层的结构性变革：Agentic AI（自主人工智能）时代的到来正逼迫企业重新设计安全架构。Dell'Oro Group最新报告揭示，传统硬件安全设备正被抛弃，软件定义、云原生平台成为投资重镇。企业不仅要保护人类员工，还要为数十亿自主决策的“AI数字员工”建立行为护栏，一个全新的安全市场逻辑正在诞生。 70亿美元安全市场爆发：Agentic AI驱动转型 2026年第一季度的网络安全支出创下历史新高，但Dell'Oro Group分析师Mauricio Sanchez指出：“物理防火墙和单一产品并未消失，但Agentic AI时代正在提升软件和云原生安全平台的价值。”这份报告的核心洞察是，企业不再购买“更多相同的东西”，而是大规模从硬件安全向集成化、软件定义的平台迁移。市场增长的核心驱动力来自企业急需为自主非人类行为体（AI代理）建立数字护栏，这直接推动了特定云原生安全领域的爆发式增长。政策平面扩张：SSE增长22%，WAF增长20% 传统“有边界可防御”的安全模型已被抛弃，取