Bonan - AaaS Hub (Page 2)

Deep

谷歌为Gemini API添加托管代理

在Google I/O 2026大会上，Google宣布为其AI代理开发平台带来重大升级，核心是在Gemini API中推出“Managed Agents”（托管代理）功能。这一新服务旨在将AI代理的开发从传统的“提问-响应”模式，彻底转向“执行-行动”模式。通过提供完全托管的执行环境（包括安全Linux沙箱、工具调用和代码执行基础设施），Google让开发者能够通过单一API调用即可启动一个能够自主规划、推理、调用工具并执行代码的AI代理，从而摆脱自行搭建复杂后端的负担。此举标志着AI代理从演示原型向生产级部署的跨越，而驱动这一切的底层模型正是Google于前一天发布的超高效模型Gemini 3.5 Flash。 Managed Agents：沙箱与基础设施的全面抽象根据Google官方博客，Managed Agents是一个由Google全权提供运行环境的系统，涵盖了AI代理运行所需的执行环境、工具调用以及代码执行沙箱。传统上，在生产环境中部署AI代理要求开发者自行准备代码执行沙箱、文件管理、外部工具集成以及处理多进程的执行基础设施。Google表示，Gemini API

Deep

港中大浙大研报：AI Agent记忆只是“备忘录”

香港中文大学与浙江大学联合发布的一篇立场论文，在学术界引发了一场关于AI Agent记忆本质的深层讨论。论文以认知科学和数学理论为武器，尖锐指出当前主流Agent记忆方案——从向量数据库到RAG、Scratchpad——本质上只是“备忘录”而非真正的记忆，存在信息量不等于能力、泛化天花板与记忆投毒三大结构性缺陷。论文提出借助神经科学中的互补学习系统理论，构建“海马体+新皮层”双系统架构，让Agent不仅能存储情景，更能将经验抽象为可泛化的规则写入权重，避免越用越蠢的窘境。从“备忘录”到“真记忆”：Agent认知困境的根源论文将当前四类主流记忆方案——向量存储、检索增强生成（RAG）、便签本（Scratchpad）与上下文窗口管理——统称为“备忘录（Memo）”。其底层逻辑均为“存储+检索”，与人类将知识内化于心的“真记忆（True Memory）”存在本质差异。研究者指出，基于检索的泛化依赖相似案例的覆盖度，而基于权重的泛化能将经验抽象为规则，应用于从未见过的输入。人类学习语言时能内化语法规则并生成新句子，而Agent只是机械地背诵例句。论文引用神经科学中的互补学习系统理论（

Events

五角大楼重组AI部门加速战场创新

美国国防部（DOW）首席数字与人工智能官Cameron Stanley上周在AFCEA华盛顿会议上宣布，国防部正在重组其AI运营架构，加速商业技术采纳，目标将整个部门转变为“AI优先”组织。作为2026年1月发布的《AI加速战略》的后续行动，此次重组将原先独立的CDAO（数字与人工智能办公室）纳入首席技术官与研发副部长体系，并与国防创新单元、DARPA及战略能力办公室协同运作，旨在将Maven Smart System等已在实战中验证的AI能力快速推广至全域。Stanley指出，在针对伊朗的“愤怒史诗”行动中，Maven系统协助规划并协调打击13000个目标，历时38天，证明AI可根本改变战争形态，这一经验必须复制到整个国防部。战略重组：CDAO纳入CTO体系，打通创新企业壁垒此前CDAO作为独立政策制定机构，重组后直接隶属于DOW首席技术官与研究与工程副部长，同时将国防创新单元、DARPA和战略能力办公室纳入统一创新指挥链。Stanley表示，这一调整使得国防部能够以前所未有的方式跨创新企业协作，真正以作战人员要求的速度将技术实战化。重组还让DOW能够积极追求和开发原型能力

Deep

Anthropic开源金融AI Skill包

在华尔街，投行分析师的噩梦莫过于周五下午五点接到MD的指令：“周一早上要一份pitch deck，把comps拉一下，DCF跑一遍。”这个周末必定泡汤。然而，Anthropic近日在GitHub上开源了一个名为claude-for-financial-services的全新仓库，直接瞄准了投行、股票研究、私募股权和财富管理这四条华尔街最昂贵的赛道。整个工具包以Apache 2.0协议开放，采用Markdown加YAML格式，无任何复杂构建步骤，fork即改。这不仅仅是工具的开源，更是Anthropic试图为金融AI生产力立下行业标准的信号。 11个端到端Agent重塑投行工作流整个仓库分为两层：11个自包含的端到端Agent，以及7个垂直行业的底层Skill包。Agent层无需预先安装繁琐依赖，直接跑完整流水线。其中最引人注目的几个Agent包括： * Pitch Agent：输入可比公司、先例交易、LBO假设，直接输出带品牌格式的pitch deck。原本需要两天的工作被压缩为一条命令。 * Model Builder：直接在Excel中运行DCF、LBO和三表模型。不

Startups

Anthropic收购Stainless 前客户含OpenAI谷歌

Anthropic宣布收购开发者工具初创公司Stainless，后者曾为包括OpenAI和Google在内的AI巨头提供SDK自动生成服务。这笔交易意味着Anthropic将一家关键AI基础设施公司收入囊中，并计划逐步关停其对外托管服务，使相关工具转为仅限内部使用。尽管双方未公布交易条款，但市场消息称价格可能超过3亿美元。此举不仅强化了Anthropic自身的开发者生态，也意味着其竞争对手将失去一项重要的AI Agent开发基础设施。交易细节：金额未披露，传闻超3亿美元 Anthropic于2026年5月19日正式宣布收购Stainless，双方未披露具体交易条款。但据The Information此前报道，Anthropic与Stainless的洽谈交易价格可能超过3亿美元。Stainless曾获得Sequoia Capital和Andreessen Horowitz的投资，成立仅四年便成为AI开发工具赛道的明星公司。Anthropic表示，将逐步停止Stainless全部托管服务产品，包括核心的SDK生成器，现有客户仍保留已生成SDK的所有权，并可继续自行修改和扩展。

Insights

Globant报告：2026技术趋势聚焦工程化AI

数字原生技术公司 Globant 近日发布《2026年技术趋势报告》，指出企业级人工智能正从概念验证走向规模化落地的关键拐点。MIT研究显示，大多数AI试点项目难以扩展，真正的挑战在于治理、系统整合与可量化的投资回报率。报告着重强调，2026年AI将从“高预期”进入“可交付价值”阶段，同时Agentic AI、量子通信、多功能机器人、环境智能与AI原生安全五大趋势相互叠加，构成未来企业竞争力的系统工程。企业AI拐点：治理与组织协同决定ROI，Agentic AI仅15%实现端到端部署报告揭示，尽管75%的企业正在尝试AI智能体，但仅15%真正部署了端到端、具备自主决策能力的系统。当前61%的应用仍停留在邮件撰写、会议纪要等局部自动化层面，难以形成结构性生产力提升。Globant指出，当企业IT与业务战略高度一致时，AI被认为具有变革价值的概率提升至1.6倍，这意味着组织协同是释放AI投资回报率的核心变量。MIT研究表明，大多数AI试点项目难以扩展，核心障碍并非模型能力，而是缺乏治理框架、系统整合能力以及可衡量的业务指标。多功能机器人市场年增20%，Agentic AI与

Deep

2026技术趋势：AI从预期到价值

2026年，企业级人工智能正从“高预期”的神坛走向“可交付价值”的地面。Globant最新发布的《2026年技术趋势报告》揭示了一个关键拐点：75%的企业正在尝试AI智能体，但仅有15%真正部署了端到端自主决策系统；61%的应用仍停留在邮件撰写、会议纪要等局部自动化层面。与此同时，量子通信、多功能机器人、环境智能与AI原生安全正形成叠加效应，未来的竞争不再是单点技术突破，而是治理、数据、组织协同的系统工程能力。以下是报告的核心洞察。 Agentic AI落地落差：61%应用停留在局部自动化报告数据显示出明显的“尝试-落地”鸿沟。75%的企业正在AI智能体，但端到端、具备自主决策能力的系统部署率仅15%。当前61%的应用仍局限于邮件撰写、会议纪要等低价值自动化场景，无法形成结构性生产力提升。Globant指出，当企业IT战略与业务战略高度一致时，AI被认为具有变革价值的概率提升至1.6倍——组织协同是释放ROI的核心变量。2026年被视为AI从“概念验证”迈向“规模落地”的关键拐点，

Latest

推理室推Tack 承诺月推AI Agent

AI Agent赛道正在迎来一轮密集的产品迭代潮。据外媒报道，一家名为Inference Room的初创企业正式发布了名为Tack的AI Agent产品，并公开承诺将以每月至少一款新产品的节奏持续输出。这一激进的产品战略不仅暴露了其抢占市场窗口期的野心，也折射出当前AI Agent领域从概念验证向规模化商业落地加速冲刺的行业态势。尽管Inference Room官方并未公布Tack的具体技术参数或应用场景，但从产品命名和“每月一款AI Agent”的承诺来看，该公司显然试图通过高频迭代建立产品矩阵，覆盖从代码生成、自动化工作流到企业级决策辅助等多元需求。这种“量贩式”发布策略在AI Agent领域尚属罕见，它要求团队具备极强的模型编排、工具链集成及快速部署能力。如果Inference Room能够兑现这一承诺，意味着其内部已构建起模块化的Agent开发框架，能够针对不同垂直场景快速组装、测试并交付。行业观察人士指出，2025年正成为AI Agent商业化落地的分水岭。OpenAI、Anthropic等一线实验室持续开放Agent能力，而像Inference Room这样的初创公

Insights

2026最佳AI代理：按用例排名对比

2026年，AI代理市场迎来关键转折。根据Ramp最新发布的AI指数，Anthropic在美国5万家企业中的工作场所采用率达到34.4%，而OpenAI以32.3%紧随其后。这组数据标志着AI工具正从单纯的“问答引擎”转向能够独立处理编码、客户支持、自动化及销售任务的智能代理。企业不再满足于聊天机器人，而是追求能完成多步骤工作流、连接业务工具并自主决策的AI代理。面对日益拥挤的市场，如何根据实际工作流程、技术水平和预算选择最适合的平台，成为CTO和业务负责人面临的核心课题。 Anthropic以34.4%企业采用率领先OpenAI，AI代理加速替代传统聊天机器人 Gartner预测，到2026年底，40%的企业应用将包含特定任务的AI代理，而这一数字在2025年还不足5%。这一趋势在最新市场数据中得到印证：Anthropic凭借Claude Code等开发者工具在企业级场景中建立优势，OpenAI则通过ChatBot等产品维持广泛渗透。两者的竞争已从模型能力延伸到代理平台的完整性和易用性。 AI代理与传统聊天机器人的本质区别在于“行动力”。聊天机器人被动回答用户输入，而AI代理

Deep

智能体变科学家：135技能一键装

一个名为 Scientific Agent Skills 的开源项目，正在重新定义 AI Agent 的能力边界。该项目为 Agent 注入 135 个覆盖生物信息学、药物发现、临床研究、材料科学等领域的编程技能，同时打通 78 个公共数据库的统一访问接口，实现“一行命令”将通用 AI Agent 升级为全栈 AI Scientist。项目上线 208 天即斩获 22,205 个 GitHub Star，日均增长 106.8 颗，fork 率达 10.8%，远超行业平均水平，标志着科研自动化工具正从“尝鲜”迈入“深度使用”阶段。

Deep

Stream开源AI代理，读取面部调整语音

传统语音AI如同盲人——无法感知用户的情绪状态，只能机械地转换文字并平板地朗读回复。Stream公司联合Anam与Inworld发布的开源AI Agent“Crashout Buddy”，彻底打破了这一局限。该Agent能够实时捕捉用户的面部表情、视线方向与参与度，并动态调整说话内容与语气。当用户沉默或显得沮丧时，它会主动感知并做出柔和反应，标志着AI交互从单向指令响应迈入多模态情感对话的新时代。从“盲人”语音助手到“会读脸”的AI：实时表情驱动交互大多数现有语音Agent仅依赖语音转文本（STT）处理，缺乏视觉通道。Crashout Buddy运行在Stream的全球边缘网络上，每秒采集8帧面部52个混合形状（blendshapes），通过MediaPipe进行情绪、视线与参与度分类。这些数据被注入Gemini大语言模型，动态引导Inworld的TTS-2语音模型输出自然语言化的表达（如“用温暖轻松的语气说”），同时由Anam的CARA模型生成逼真且唇形同步的虚拟形象。Deepgram负责语音识别，整套流程实现端到端实时响应。技术架构：多模态感知栈与边缘网络实时处理

Deep

MemPrivacy开源守护AI记忆隐私

当AI助手开始记住你的血压、工作日程乃至银行卡号，隐私与个性化之间的天平正在剧烈摇摆。2026年5月，记忆张量MemTensor与荣耀HONOR联合推出的开源框架MemPrivacy，以突破性的“本地可逆伪匿名化”技术，在保护用户敏感数据的同时，将智能体效用损失控制在1%以内。更令人震惊的是，在同一评测基准上，其隐私识别F1分数高达85.97%，一举超越OpenAI同期发布的privacy-filter模型整整50个百分点，为端云协同的Agent长期记忆难题提供了可落地的工程解法。 OpenAI仅8类标签，MemPrivacy F1飙升至85.97% OpenAI于2026年4月22日开源的privacy-filter模型采用1.5B参数（激活50M），支持128k上下文，但仅提供8类基础隐私标签。在针对200用户、超15.5万隐私项构建的MemPrivacy-Bench基准测试中，该模型综合F1分数仅为35.50%。相比之下，记忆张量团队联合荣耀推出的MemPrivacy-4B-RL模型在同一测试中达到85.97%，领先幅度高达50.47%。即使在跨分布数据集PersonaMe