Agent范式转移:从Manus到Claude Code的六阶段演进

Agent范式转移:从Manus到Claude Code的六阶段演进
Photo by Chris Ried / Unsplash

过去一年,Agent赛道经历了一场螺旋式上升的范式循环,从Manus的产品化启蒙,到OpenClaw验证市场对AI操控电脑(Computer Use)的付费意愿,再到Claude Code以原生系统级能力冲击工业级市场。这场由GAIR Live圆桌讨论揭示的变革,标志着Agent竞争已从模型智力的单点突破,转向工程能力、场景落地、数据主权和生态构建的全方位较量。随着Computer Use成为核心战场,Coding被确立为Agent扩展能力的第一性原理,行业正从“单体能力比拼”进入“系统工程与生态卡位”的深水区,创业者的生存空间面临剧烈波动,而真正的产业变革才刚刚开始。

Manus、OpenClaw、Claude Code的定位与跃迁

Agent产业的爆发遵循清晰的阶段化规律。根据OpenManus核心贡献者张佳钇提出的“六阶段论”,Manus处于“预定义环境自主Agent”阶段,其目标与环境权限由人类预设。反直觉的是,技术演进顺序应为Claude Code/CodeX在前,OpenClaw在后——正是Claude Code等工具验证了Coding与系统操控的极强可用性,才催生OpenClaw将能力从开发者群体延伸至普通非开发者用户,完成了大众化市场的渗透。张佳钇指出,CodeX的能力经历了两次显著跃迁:2025年9月已能完成约80%的科研代码工作,支持三至四小时的长程执行;2025年12月长程执行能力进一步增强,代码产出质量有质的飞跃。Claude Code基于CodeX 5.4,实现了通过Bash工具同时处理文本、代码和GUI环境,并通过OS指令直接操控屏幕,标志着模型进入能同时处理不同环境任务的空间。

Computer Use成为核心战场

OpenClaw的爆火本质是市场对本地操作、数据主权、隐私可控需求的集中释放,让Computer Use正式成为Agent竞争的核心赛道。Nanponova AI创始人常楠直言,Computer Use解决的是人机交互的“历史遗留问题”:过去所有软件都为人类设计,GUI统治生态;而Agent时代,交互正在向计算机原生的CLI形态回归。未来应用会拥有两套接口,即保留GUI供人类使用,同时搭建AI专属原生接口。当前Computer Use的爆发,核心驱动力是多模态大模型(VLM)的技术成熟,视觉能力与系统操作能力结合,让模型代劳的工作范围呈几何级扩张。

当前Computer Use形成两条核心技术路线:基于视觉VLM模拟点击(OpenClaw路线)、通过原生指令集系统接管(Claude Code路线)。海外平台接口开放,原生指令集效率更高;国内内容生态高度封闭,视觉方案成为跨越“围墙花园”的主要渠道。张佳钇补充,Computer Use的核心是为Agent获取更多上下文与权限,CLI方案在专业场景效率更高,而视觉VLM是更通用的能力,能覆盖海量未知长尾场景。长路径决策的幻觉积累是最大技术难点,巨头在强化学习数据上占据优势,而Claude Code走出的“视觉+系统指令”混合模式,成为全行业可借鉴的方向。

Coding是Agent的“第一性原理”

在本轮范式演进中,Coding的核心地位被反复强调。常楠高度认可Anthropic的路径:编程不只是写代码,而是系统级问题解决。当Agent能在现有工具不足时自主编程创造新工具,才真正具备工业级价值,这也是区分“单纯效率工具”与“真正智能体”的分水岭。相比简单的屏幕识别和模拟点击,能够理解系统底层逻辑并生成执行代码的Agent,才能支撑复杂任务、长程执行与跨场景协作。

2025年初Claude Code初版受限于基座能力,随着模型迭代,Agent架构从Manus式的“手工流”快速升级为深度“智能体流”。未来理想场景是Agent网络:向网络发布任务,现有Agent无法完成时,自动协作并自主编写新工具解决问题,这正是Coding作为第一性原理的终极体现。常楠强调,Coding是Agent扩展能力边界的第一基石,是Agent的第一性原理。

效率工具创业者面临“降维打击”,垂直场景迎来红利

范式的快速演变,对一线创业者带来了生存空间的剧烈波动,行业呈现两极分化。常楠判断:基模公司必然从售卖Token延伸至产品侧与效率侧,纯效率工具类创业者将面临降维打击;而垂直场景应用开发者则迎来重大利好。他的团队围绕Claude Code构建Skill Set与Harness,实现从需求分析、PRD生成、TDD到代码编写的全链路自动化,原本一两个月的交付周期压缩至一周,效能提升呈指数级。

同时,企业需求的分化进一步加剧行业格局:大型企业极度看重过程可审计、数据私有化,倾向私有化部署;中小企业与个人用户更看重便利性,愿意适度让渡隐私。中国与海外的生态差异,也让OpenClaw这类轻量化、本地化产品在国内获得远超硅谷的热度。张佳钇指出,开源社区需通过快速迭代增加用户实际使用体感更多的功能,如OpenCLI将小红书、推特等软件变成自动CRA工具,开箱即用,虽然不涉及炫酷概念,但因解决用户问题而获得关注。

Agent的下一轮爆发点:从模型智力到系统工程

圆桌的最后,两位嘉宾共同指向一个核心结论:Agent竞争已彻底从“模型智力”转向“系统工程能力”,VLM与CLI路线、开源与闭源、通用与垂直,最终都要回归“为用户创造真实价值”的本质。张佳钇预判了Agent的两大未来方向:一是个性化学习,Agent从交互中学习个人偏好,行业急需建立个人偏好与智能体行为关联的数据标准;二是智能体网络(Agent Network),企业内智能体获得全员权限,处理文档、会议、协作,推动组织向AI Native转型;社会层面,个人知识技能通过Agent资产化、可交易,智能体间实现自动任务定价,这一方向将在近几个月迎来重大机会。

而整个产业的螺旋进击,最终会走向一个清晰的终局:模型厂商聚焦底层能力与生态构建,开源社区负责轻量化创新与用户体验补全,创业者深耕垂直场景与行业Know-how,三方形成互补共生的生态。Manus完成启蒙,OpenClaw验证需求,Claude Code定义工业级标准,三者共同推开了Agent时代的大门,而真正的产业变革,才刚刚开始。

Read more

阿里免费高考志愿Agent上线

阿里免费高考志愿Agent上线

2026年高考落下帷幕,志愿填报这一决定考生命运的关键环节,正在被AI Agent技术彻底重塑。面对1290万考生、近3000所高校与2000多个专业构成的庞大选择迷宫,传统的被动式问答Chatbot已显力不从心。阿里巴巴旗下的千问近日宣布,推出国内首个全周期高考志愿填报Agent,并面向全国考生免费开放。这款产品不仅能够主动规划、持久记忆用户偏好,更通过40万“AI考生”的对抗压测,将志愿规划师的专业经验沉淀进了模型底层。从知识库构筑、对抗强化学习到动态方案生成,千问正试图用AI弥合长期存在的高考信息鸿沟,让每一位考生都能享受公平而专业的选择权。 Agent入场:从“被动应答”到“主动规划”的范式革命 千问高考志愿Agent的上线,标志着AI在复杂决策场景中的进化。与聊天机器人不同,Agent具备三大核心能力:持久记忆,能记住用户说过的每一句话;主动规划,如自动生成“志愿日历”提醒关键时间节点;实时工具调用与反思,让回答更加精准。以北京一位660分、理化生选科、目标人工智能专业的考生为例,Agent在接收填写的省份、成绩、专业偏好乃至MBTI性格类型后,自动生成包含院校推荐、专

By Danfeng
科大讯飞发布SpaceMind

科大讯飞发布SpaceMind

2026年6月10日,科大讯飞在其英文名iFLYTEK于香港举办的全球发布会上,正式推出智慧空间Agentic架构SpaceMind。这一架构标志着人工智能Agent从虚拟数字世界加速迈入物理空间,赋予楼宇、家居等实体环境以自主思考、真实记忆与自学习能力。SpaceMind通过60GHz毫米波雷达实现5厘米级精准定位,并采用双模型协同架构将设备指令响应速度压缩至700毫秒以内,能够实时感知用户需求与环境变化,主动联动各类设备提供个性化服务。此举不仅巩固了科大讯飞在AI软硬一体战略中的技术护城河,也为智慧空间行业树立了新的交互基准。 60GHz毫米波雷达与双模型协同:重新定义空间感知精度 SpaceMind的核心技术突破在于其感知层与决策层的协同设计。根据发布会披露,该架构搭载60GHz毫米波雷达,能够实现5厘米级的室内定位精度,远超传统蓝牙或Wi-Fi方案的米级误差。在决策层面,双模型协同架构将设备指令的响应速度提升至700毫秒以内,这意味着用户在物理空间中的一举一动——从走进房间到语音指令发出——系统均能在亚秒级内完成感知、理解与设备联动。这种低延迟、高精度的交互能力,使Spa

By Danfeng
GitHub和Hugging Face创始人注资AI代理初创Zaro

GitHub和Hugging Face创始人注资AI代理初创Zaro

总部位于伦敦的初创公司Zaro成功完成510万美元融资,由知名风投Cherry Ventures领投,并罕见地获得了代码托管巨头GitHub联合创始人Thomas Dohmke与开源AI平台Hugging Face联合创始人Thomas Wolf的个人背书。这笔投资不仅点燃了AI Agent(智能体)赛道的新热度,更揭示了行业正在从“通用聊天机器人”加速迈向“定制化数字劳动力”的关键拐点。 硅谷传奇创始人押注,企业级AI Agent从“演示”到“部署” Zaro的创始团队由Tommy Barav领导,他此前是AI初创公司Lovable(原名GPT Engineer)的增长顾问。该公司提供的核心服务是帮助客户构建定制化的AI Agent,其目标市场直指企业自动化中尚未被完全开发的“灰色地带”。据Zaro透露,其技术栈能够将AI Agent从单纯的对话工具升级为能够独立执行复杂业务流程的“虚拟员工”。本次融资的投资者阵容星光熠熠,GitHub的Dohmke和Hugging Face的Wolf以“天使投资人”身份加入,此外还有Spotify早期高管Petter Carlsson和马士基

By Muhuai
代理AI引爆700亿安全市场重塑

代理AI引爆700亿安全市场重塑

全球网络安全市场在2026年第一季度突破70亿美元大关,同比增长14%,这一稳健增长背后隐藏着更深层的结构性变革:Agentic AI(自主人工智能)时代的到来正逼迫企业重新设计安全架构。Dell'Oro Group最新报告揭示,传统硬件安全设备正被抛弃,软件定义、云原生平台成为投资重镇。企业不仅要保护人类员工,还要为数十亿自主决策的“AI数字员工”建立行为护栏,一个全新的安全市场逻辑正在诞生。 70亿美元安全市场爆发:Agentic AI驱动转型 2026年第一季度的网络安全支出创下历史新高,但Dell'Oro Group分析师Mauricio Sanchez指出:“物理防火墙和单一产品并未消失,但Agentic AI时代正在提升软件和云原生安全平台的价值。”这份报告的核心洞察是,企业不再购买“更多相同的东西”,而是大规模从硬件安全向集成化、软件定义的平台迁移。市场增长的核心驱动力来自企业急需为自主非人类行为体(AI代理)建立数字护栏,这直接推动了特定云原生安全领域的爆发式增长。 政策平面扩张:SSE增长22%,WAF增长20% 传统“有边界可防御”的安全模型已被抛弃,取

By Danfeng