谷歌为Gemini API添加托管代理
在Google I/O 2026大会上,Google宣布为其AI代理开发平台带来重大升级,核心是在Gemini API中推出“Managed Agents”(托管代理)功能。这一新服务旨在将AI代理的开发从传统的“提问-响应”模式,彻底转向“执行-行动”模式。通过提供完全托管的执行环境(包括安全Linux沙箱、工具调用和代码执行基础设施),Google让开发者能够通过单一API调用即可启动一个能够自主规划、推理、调用工具并执行代码的AI代理,从而摆脱自行搭建复杂后端的负担。此举标志着AI代理从演示原型向生产级部署的跨越,而驱动这一切的底层模型正是Google于前一天发布的超高效模型Gemini 3.5 Flash。
Managed Agents:沙箱与基础设施的全面抽象
根据Google官方博客,Managed Agents是一个由Google全权提供运行环境的系统,涵盖了AI代理运行所需的执行环境、工具调用以及代码执行沙箱。传统上,在生产环境中部署AI代理要求开发者自行准备代码执行沙箱、文件管理、外部工具集成以及处理多进程的执行基础设施。Google表示,Gemini API Managed Agents将这些复杂的底层架构完全抽象化,让开发者能专注于产品体验设计和AI代理行为逻辑的定制。开发者只需调用Gemini API中的Interactions API,即可为应用注入一个具备完全自主能力的AI代理,无需操心服务器、沙箱或文件系统的维护。
Antigravity Agent与Gemini 3.5 Flash:自主循环与性能飞跃
Managed Agents的核心是“Antigravity Agent”(反重力代理),它在Google托管的Linux沙箱中运行,默认具备代码执行、Google搜索和URL读取能力,并可进一步扩展以支持文件读写、编辑、搜索和列表操作。该代理在接收任务后,会自主规划执行步骤,调用所需工具,检查执行结果,并循环直至任务完成。文件与状态可在执行环境中持久保留,因此可用于跨多次API调用的连续工作会话。Antigravity Agent基于Google于2026年5月19日发布的Gemini 3.5 Flash模型——这是Gemini 3.5系列的首发模型,在几乎所有基准测试中超越Gemini 3.1 Pro,同时运行速度比其他前沿模型快4倍。开发者还可以通过添加自定义指令、工具、数据和技能来定制代理,例如将代理的运作政策写入“AGENTS.md”文件并加载到沙箱中,定制后的代理可保存并复用为Managed Agent。
预览版可用性、计费细节与功能限制
目前Managed Agent特性在Gemini API的Interactions API和Google AI Studio中提供预览。预览期间,CPU、内存和沙箱执行等环境计算资源完全免费,但底层Gemini模型以及代理工具使用的token将按量计费。需要注意的是,由于代理会自主循环进行推理、工具执行、代码执行和文件操作,token消耗可能相当庞大。目前该预览版尚不支持结构化输出,且部分工具(如file_search、computer_use、google_maps、function_calling、mcp)暂时不可用,输入格式仅限文本和图片。此外,Google同步宣布将Gemini CLI迁移至Antigravity CLI,以提供与Antigravity 2.0桌面应用共通的执行平台,支持多代理协同完成复杂任务。关键功能如Agent Skills、Hooks、Subagents以及Extensions(现更名为Antigravity插件)将被保留。