Bonan

Bonan
谷歌为Gemini API添加托管代理

Deep

谷歌为Gemini API添加托管代理

在Google I/O 2026大会上,Google宣布为其AI代理开发平台带来重大升级,核心是在Gemini API中推出“Managed Agents”(托管代理)功能。这一新服务旨在将AI代理的开发从传统的“提问-响应”模式,彻底转向“执行-行动”模式。通过提供完全托管的执行环境(包括安全Linux沙箱、工具调用和代码执行基础设施),Google让开发者能够通过单一API调用即可启动一个能够自主规划、推理、调用工具并执行代码的AI代理,从而摆脱自行搭建复杂后端的负担。此举标志着AI代理从演示原型向生产级部署的跨越,而驱动这一切的底层模型正是Google于前一天发布的超高效模型Gemini 3.5 Flash。 Managed Agents:沙箱与基础设施的全面抽象 根据Google官方博客,Managed Agents是一个由Google全权提供运行环境的系统,涵盖了AI代理运行所需的执行环境、工具调用以及代码执行沙箱。传统上,在生产环境中部署AI代理要求开发者自行准备代码执行沙箱、文件管理、外部工具集成以及处理多进程的执行基础设施。Google表示,Gemini API

By Bonan
港中大浙大研报:AI Agent记忆只是“备忘录”

Deep

港中大浙大研报:AI Agent记忆只是“备忘录”

香港中文大学与浙江大学联合发布的一篇立场论文,在学术界引发了一场关于AI Agent记忆本质的深层讨论。论文以认知科学和数学理论为武器,尖锐指出当前主流Agent记忆方案——从向量数据库到RAG、Scratchpad——本质上只是“备忘录”而非真正的记忆,存在信息量不等于能力、泛化天花板与记忆投毒三大结构性缺陷。论文提出借助神经科学中的互补学习系统理论,构建“海马体+新皮层”双系统架构,让Agent不仅能存储情景,更能将经验抽象为可泛化的规则写入权重,避免越用越蠢的窘境。 从“备忘录”到“真记忆”:Agent认知困境的根源 论文将当前四类主流记忆方案——向量存储、检索增强生成(RAG)、便签本(Scratchpad)与上下文窗口管理——统称为“备忘录(Memo)”。其底层逻辑均为“存储+检索”,与人类将知识内化于心的“真记忆(True Memory)”存在本质差异。研究者指出,基于检索的泛化依赖相似案例的覆盖度,而基于权重的泛化能将经验抽象为规则,应用于从未见过的输入。人类学习语言时能内化语法规则并生成新句子,而Agent只是机械地背诵例句。论文引用神经科学中的互补学习系统理论(

By Bonan
五角大楼重组AI部门加速战场创新

Events

五角大楼重组AI部门加速战场创新

美国国防部(DOW)首席数字与人工智能官Cameron Stanley上周在AFCEA华盛顿会议上宣布,国防部正在重组其AI运营架构,加速商业技术采纳,目标将整个部门转变为“AI优先”组织。作为2026年1月发布的《AI加速战略》的后续行动,此次重组将原先独立的CDAO(数字与人工智能办公室)纳入首席技术官与研发副部长体系,并与国防创新单元、DARPA及战略能力办公室协同运作,旨在将Maven Smart System等已在实战中验证的AI能力快速推广至全域。Stanley指出,在针对伊朗的“愤怒史诗”行动中,Maven系统协助规划并协调打击13000个目标,历时38天,证明AI可根本改变战争形态,这一经验必须复制到整个国防部。 战略重组:CDAO纳入CTO体系,打通创新企业壁垒 此前CDAO作为独立政策制定机构,重组后直接隶属于DOW首席技术官与研究与工程副部长,同时将国防创新单元、DARPA和战略能力办公室纳入统一创新指挥链。Stanley表示,这一调整使得国防部能够以前所未有的方式跨创新企业协作,真正以作战人员要求的速度将技术实战化。重组还让DOW能够积极追求和开发原型能力

By Bonan
Anthropic开源金融AI Skill包

Deep

Anthropic开源金融AI Skill包

在华尔街,投行分析师的噩梦莫过于周五下午五点接到MD的指令:“周一早上要一份pitch deck,把comps拉一下,DCF跑一遍。”这个周末必定泡汤。然而,Anthropic近日在GitHub上开源了一个名为claude-for-financial-services的全新仓库,直接瞄准了投行、股票研究、私募股权和财富管理这四条华尔街最昂贵的赛道。整个工具包以Apache 2.0协议开放,采用Markdown加YAML格式,无任何复杂构建步骤,fork即改。这不仅仅是工具的开源,更是Anthropic试图为金融AI生产力立下行业标准的信号。 11个端到端Agent重塑投行工作流 整个仓库分为两层:11个自包含的端到端Agent,以及7个垂直行业的底层Skill包。Agent层无需预先安装繁琐依赖,直接跑完整流水线。其中最引人注目的几个Agent包括: * Pitch Agent:输入可比公司、先例交易、LBO假设,直接输出带品牌格式的pitch deck。原本需要两天的工作被压缩为一条命令。 * Model Builder:直接在Excel中运行DCF、LBO和三表模型。不

By Bonan
Anthropic收购Stainless 前客户含OpenAI谷歌

Startups

Anthropic收购Stainless 前客户含OpenAI谷歌

Anthropic宣布收购开发者工具初创公司Stainless,后者曾为包括OpenAI和Google在内的AI巨头提供SDK自动生成服务。这笔交易意味着Anthropic将一家关键AI基础设施公司收入囊中,并计划逐步关停其对外托管服务,使相关工具转为仅限内部使用。尽管双方未公布交易条款,但市场消息称价格可能超过3亿美元。此举不仅强化了Anthropic自身的开发者生态,也意味着其竞争对手将失去一项重要的AI Agent开发基础设施。 交易细节:金额未披露,传闻超3亿美元 Anthropic于2026年5月19日正式宣布收购Stainless,双方未披露具体交易条款。但据The Information此前报道,Anthropic与Stainless的洽谈交易价格可能超过3亿美元。Stainless曾获得Sequoia Capital和Andreessen Horowitz的投资,成立仅四年便成为AI开发工具赛道的明星公司。Anthropic表示,将逐步停止Stainless全部托管服务产品,包括核心的SDK生成器,现有客户仍保留已生成SDK的所有权,并可继续自行修改和扩展。

By Bonan
Globant报告:2026技术趋势聚焦工程化AI

Insights

Globant报告:2026技术趋势聚焦工程化AI

数字原生技术公司 Globant 近日发布《2026年技术趋势报告》,指出企业级人工智能正从概念验证走向规模化落地的关键拐点。MIT研究显示,大多数AI试点项目难以扩展,真正的挑战在于治理、系统整合与可量化的投资回报率。报告着重强调,2026年AI将从“高预期”进入“可交付价值”阶段,同时Agentic AI、量子通信、多功能机器人、环境智能与AI原生安全五大趋势相互叠加,构成未来企业竞争力的系统工程。 企业AI拐点:治理与组织协同决定ROI,Agentic AI仅15%实现端到端部署 报告揭示,尽管75%的企业正在尝试AI智能体,但仅15%真正部署了端到端、具备自主决策能力的系统。当前61%的应用仍停留在邮件撰写、会议纪要等局部自动化层面,难以形成结构性生产力提升。Globant指出,当企业IT与业务战略高度一致时,AI被认为具有变革价值的概率提升至1.6倍,这意味着组织协同是释放AI投资回报率的核心变量。MIT研究表明,大多数AI试点项目难以扩展,核心障碍并非模型能力,而是缺乏治理框架、系统整合能力以及可衡量的业务指标。 多功能机器人市场年增20%,Agentic AI与

By Bonan
2026技术趋势:AI从预期到价值

Deep

2026技术趋势:AI从预期到价值

2026年,企业级人工智能正从“高预期”的神坛走向“可交付价值”的地面。Globant最新发布的《2026年技术趋势报告》揭示了一个关键拐点:75%的企业正在尝试AI智能体,但仅有15%真正部署了端到端自主决策系统;61%的应用仍停留在邮件撰写、会议纪要等局部自动化层面。与此同时,量子通信、多功能机器人、环境智能与AI原生安全正形成叠加效应,未来的竞争不再是单点技术突破,而是治理、数据、组织协同的系统工程能力。以下是报告的核心洞察。 Agentic AI落地落差:61%应用停留在局部自动化 报告数据显示出明显的“尝试-落地”鸿沟。75%的企业正在AI智能体,但端到端、具备自主决策能力的系统部署率仅15%。当前61%的应用仍局限于邮件撰写、会议纪要等低价值自动化场景,无法形成结构性生产力提升。Globant指出,当企业IT战略与业务战略高度一致时,AI被认为具有变革价值的概率提升至1.6倍——组织协同是释放ROI的核心变量。2026年被视为AI从“概念验证”迈向“规模落地”的关键拐点,

By Bonan
推理室推Tack 承诺月推AI Agent

Latest

推理室推Tack 承诺月推AI Agent

AI Agent赛道正在迎来一轮密集的产品迭代潮。据外媒报道,一家名为Inference Room的初创企业正式发布了名为Tack的AI Agent产品,并公开承诺将以每月至少一款新产品的节奏持续输出。这一激进的产品战略不仅暴露了其抢占市场窗口期的野心,也折射出当前AI Agent领域从概念验证向规模化商业落地加速冲刺的行业态势。 尽管Inference Room官方并未公布Tack的具体技术参数或应用场景,但从产品命名和“每月一款AI Agent”的承诺来看,该公司显然试图通过高频迭代建立产品矩阵,覆盖从代码生成、自动化工作流到企业级决策辅助等多元需求。这种“量贩式”发布策略在AI Agent领域尚属罕见,它要求团队具备极强的模型编排、工具链集成及快速部署能力。如果Inference Room能够兑现这一承诺,意味着其内部已构建起模块化的Agent开发框架,能够针对不同垂直场景快速组装、测试并交付。 行业观察人士指出,2025年正成为AI Agent商业化落地的分水岭。OpenAI、Anthropic等一线实验室持续开放Agent能力,而像Inference Room这样的初创公

By Bonan
2026最佳AI代理:按用例排名对比

Insights

2026最佳AI代理:按用例排名对比

2026年,AI代理市场迎来关键转折。根据Ramp最新发布的AI指数,Anthropic在美国5万家企业中的工作场所采用率达到34.4%,而OpenAI以32.3%紧随其后。这组数据标志着AI工具正从单纯的“问答引擎”转向能够独立处理编码、客户支持、自动化及销售任务的智能代理。企业不再满足于聊天机器人,而是追求能完成多步骤工作流、连接业务工具并自主决策的AI代理。面对日益拥挤的市场,如何根据实际工作流程、技术水平和预算选择最适合的平台,成为CTO和业务负责人面临的核心课题。 Anthropic以34.4%企业采用率领先OpenAI,AI代理加速替代传统聊天机器人 Gartner预测,到2026年底,40%的企业应用将包含特定任务的AI代理,而这一数字在2025年还不足5%。这一趋势在最新市场数据中得到印证:Anthropic凭借Claude Code等开发者工具在企业级场景中建立优势,OpenAI则通过ChatBot等产品维持广泛渗透。两者的竞争已从模型能力延伸到代理平台的完整性和易用性。 AI代理与传统聊天机器人的本质区别在于“行动力”。聊天机器人被动回答用户输入,而AI代理

By Bonan
智能体变科学家:135技能一键装

Deep

智能体变科学家:135技能一键装

一个名为 Scientific Agent Skills 的开源项目,正在重新定义 AI Agent 的能力边界。该项目为 Agent 注入 135 个覆盖生物信息学、药物发现、临床研究、材料科学等领域的编程技能,同时打通 78 个公共数据库的统一访问接口,实现“一行命令”将通用 AI Agent 升级为全栈 AI Scientist。项目上线 208 天即斩获 22,205 个 GitHub Star,日均增长 106.8 颗,fork 率达 10.8%,远超行业平均水平,标志着科研自动化工具正从“尝鲜”迈入“深度使用”阶段。

By Bonan
Stream开源AI代理,读取面部调整语音

Deep

Stream开源AI代理,读取面部调整语音

传统语音AI如同盲人——无法感知用户的情绪状态,只能机械地转换文字并平板地朗读回复。Stream公司联合Anam与Inworld发布的开源AI Agent“Crashout Buddy”,彻底打破了这一局限。该Agent能够实时捕捉用户的面部表情、视线方向与参与度,并动态调整说话内容与语气。当用户沉默或显得沮丧时,它会主动感知并做出柔和反应,标志着AI交互从单向指令响应迈入多模态情感对话的新时代。 从“盲人”语音助手到“会读脸”的AI:实时表情驱动交互 大多数现有语音Agent仅依赖语音转文本(STT)处理,缺乏视觉通道。Crashout Buddy运行在Stream的全球边缘网络上,每秒采集8帧面部52个混合形状(blendshapes),通过MediaPipe进行情绪、视线与参与度分类。这些数据被注入Gemini大语言模型,动态引导Inworld的TTS-2语音模型输出自然语言化的表达(如“用温暖轻松的语气说”),同时由Anam的CARA模型生成逼真且唇形同步的虚拟形象。Deepgram负责语音识别,整套流程实现端到端实时响应。 技术架构:多模态感知栈与边缘网络实时处理

By Bonan
MemPrivacy开源守护AI记忆隐私

Deep

MemPrivacy开源守护AI记忆隐私

当AI助手开始记住你的血压、工作日程乃至银行卡号,隐私与个性化之间的天平正在剧烈摇摆。2026年5月,记忆张量MemTensor与荣耀HONOR联合推出的开源框架MemPrivacy,以突破性的“本地可逆伪匿名化”技术,在保护用户敏感数据的同时,将智能体效用损失控制在1%以内。更令人震惊的是,在同一评测基准上,其隐私识别F1分数高达85.97%,一举超越OpenAI同期发布的privacy-filter模型整整50个百分点,为端云协同的Agent长期记忆难题提供了可落地的工程解法。 OpenAI仅8类标签,MemPrivacy F1飙升至85.97% OpenAI于2026年4月22日开源的privacy-filter模型采用1.5B参数(激活50M),支持128k上下文,但仅提供8类基础隐私标签。在针对200用户、超15.5万隐私项构建的MemPrivacy-Bench基准测试中,该模型综合F1分数仅为35.50%。相比之下,记忆张量团队联合荣耀推出的MemPrivacy-4B-RL模型在同一测试中达到85.97%,领先幅度高达50.47%。即使在跨分布数据集PersonaMe

By Bonan