ChatSee获650万融资,打造AI失败记忆系统

ChatSee获650万融资,打造AI失败记忆系统
Photo by Ecliptic Graphic / Unsplash

企业级AI智能体的规模化落地正面临前所未有的信任危机——测试无法穷尽所有故障,细微偏差可能在自动化流程中迅速放大。针对这一痛点,初创公司ChatSee.AI近日完成650万美元种子轮融资,推出名为“失败智能层”的核心产品,试图为自主AI系统构建一个能够记录、学习并预防错误的“中央记忆系统”。本轮融资由True Ventures领投,First Rays Venture Partners、Seven Hills Ventures及多位行业资深人士参投,标志着资本对AI运行时治理赛道的持续加注。

650万美元融资瞄准“失败智能层”:填补企业AI信心缺口

“不管企业是否愿意,AI已经进入企业内部。”ChatSee联合创始人兼首席执行官Sekhar Sarukkai在采访中直言。随着微软Copilot、Databricks Genie、Snowflake、OpenAI、Anthropic等平台以及开源生态(OpenClaw、NemoClaw、Hermes)将AI智能体渗透至电商定价、金融交易分类等核心业务,企业的关注点已从“能否在模拟环境中构建”转向“能否将其托付给真实客户与员工”。Sarukkai指出,AI本质上是“不确定性基础设施”,仅靠静态测试无法规避所有运行时故障。ChatSee的“失败智能层”正是在此背景下诞生:它能在智能体出现故障时自动观测并保留完整上下文,记录人工修复方式,并将这些知识反馈回系统,从而帮助后续智能体规避同类错误。

基于万条案例构建157类故障分类体系:从幻觉到推理偏差

ChatSee的技术架构并非从零开始。公司基于超过1万条企业智能体真实故障案例,构建了一套涵盖157个类别的精细化故障分类体系。这些类别不仅包括业界熟知的“幻觉”问题,更延伸至工具调用失败、范围界定错误、推理偏差和执行中断等细微却影响深远的维度。这一系统将可观测性和纠错范围大幅扩展,使运维团队能够从“知道发生了什么”进步到“知道为何失败以及如何修复”。当某个智能体反复出现工具调用失败或API中断时,系统将自动执行自我修正,并将关键修正信息写入中央知识库——这一被Sarukkai称为“失败知识库”的机制,可在平台层面配置为由所有智能体自动参考。

从失败知识库到自我修复的智能体生态:可观测性、评估与记忆的三层演进

“智能不会流失——我们持续积累来自人类反馈和系统自身判断的失败智能。”Sarukkai强调。ChatSee的终极愿景并非止步于可观测性(Observability)和评估(Evaluation),而是成为记录“什么失败了、为何失败、如何防止复发”的中央记忆层。目前,同行竞争者如Voker(智能体表现平台)、Respan(跨智能体根因分析)、Monte Carlo Data(AI可观测性)正从不同维度切入市场,但ChatSee独辟蹊径地聚焦于“失败记忆”。TAG-infosphere首席执行官Eduard Amoroso博士评论称:“大多数AI风险发生在运行时自主运作过程中,概率性和自适应性令静态测试永远不够——这正是持续运行时保障的刚需场景。”随着智能体从单兵作战走向集群协作,以及与人类并肩工作的模式普及,自我学习、自我修复的智能体生态将迎来更广阔的发展空间。

Read more

AI代理致GitHub宕机,微软急寻AWS支援

AI代理致GitHub宕机,微软急寻AWS支援

在AI编码代理的爆发式增长面前,微软旗下的开发者平台GitHub正经历前所未有的可靠性危机。为了履行对企业客户的服务等级协议(SLA),微软被迫做出了一个令人瞩目的决定:将部分GitHub流量路由至其主要云竞争对手亚马逊云服务(AWS)的基础设施上。此举不仅暴露了Azure云在应对AI驱动工作负载时的容量瓶颈,也揭示了GitHub自2008年构建的Ruby on Rails单体架构,在面对机器速度的连续式流量冲击时的结构性缺陷。 AI代理流量激增325%,275周均千万级Commit压垮容量模型 导致此次危机的直接原因,是AI编码代理活动量的指数级增长。2026年3月,由AI代理发起的Pull Request数量较半年前激增325%,达到1700万个,而2025年9月这一数字仅为400万。这些代理(如Cursor、Claude Code、GitHub Copilot、Devin等)的运行模式与人类开发者截然不同:它们通过API和命令行全天候连续运作,无视周末和节假日,彻底打破了GitHub原有的容量规划模型。GitHub COO Kyle Daigle在4月证实,该平台每周处理C

By Danfeng
月之暗面推万亿参数模型与300Agent集群

月之暗面推万亿参数模型与300Agent集群

月之暗面(Moonshot AI)于2026年夏季同步推出两款核心产品:开源代码模型Kimi-K2.7-Code与支持300个子Agent协同作业的桌面Agent应用。前者通过MoE架构与思考优化,将万亿参数模型的无效成本削减30%,后者则首次将AI工作模式从“单兵作战”升级为“虚拟团队”。这套组合拳标志着AI从比拼参数规模的“学霸竞赛”,正式转向以提效与协作能力为导向的“组织智能”新阶段。 万亿参数模型“减负”:Kimi-K2.7-Code大幅降低推理成本 Kimi-K2.7-Code采用1.1万亿参数的MoE(混合专家)架构,搭载256K超长上下文。其核心突破不在参数规模,而在针对性解决行业“过度推理”痛点——许多AI模型处理简单任务时输出大量冗余思考,导致token消耗高企,部分长代码场景的调用费用甚至超过人力。该模型通过优化,使得平均思考token消耗降低30%。同时,依托MoE特性,运行时仅激活320亿相关参数,实现算力精准分配。性能测试显示,该模型在Kimi Code Bench v2基准中提升21.8%,Program Bench提升11%,MLS Bench

By Yuchen
华为小艺升级为Agent时代基建

华为小艺升级为Agent时代基建

Agent技术在全球爆发,但如何从极客玩具变为全民服务成为行业核心挑战。华为在HDC 2026上给出了答案:将小艺与HarmonyOS深度融合,通过鸿蒙智能体框架HMAF 2.0打造“意图即服务”的开放入口。这不仅是技术升级,更是一次生态理念的落地——华为选择把系统级Agent基建做好,然后向所有开发者公平开放,意图在Agent时代的平台变革中,让每一个开发者都能获得确定性机会。 全球科技巨头押注操作系统+Agent融合,鸿蒙率先开放生态 Agent时代入口的争夺已成为科技巨头的战略高地。Apple在WWDC 2026通过深度模型合作将Siri重构为系统级Agent,Google则将Android升级为“intelligence system”。然而,华为选择了一条差异化路径:不垄断入口,而是把入口建好并打开。6月12日,HDC 2026上,鸿蒙宣布Harmony Intelligence全面向Agent架构演进,小艺成为鸿蒙系统与Agent之间的桥梁。基于全新Agentic自演进架构,小艺与HarmonyOS深度融合,成为系统的智慧大脑,能够调用系统应用Skills、生态Ski

By Muhuai
AI代理风险剧增:每日21万次异常事件行为

AI代理风险剧增:每日21万次异常事件行为

随着企业将AI代理深度嵌入日常运营,其运行时行为正成为新的安全与合规风险来源。安全公司Codenotary的最新监测数据显示,其AgentMon平台每天追踪超过300万次AI代理交互,其中约21万次(占比7%)被标记为潜在不安全或不合规行为。这些异常并非来自传统恶意软件或外部攻击,而是源于AI系统在合法工作流中产生的意外或危险行为——这一发现标志着企业AI治理正从模型开发阶段转向执行层面。 AI代理运行时风险放大 Codenotary基于其AgentMon在企业客户环境中的部署数据指出,监测到的风险类型覆盖安全、合规与操作异常。具体包括:敏感信息泄露(如密码、API令牌、加密材料、财务记录、医疗数据及机密内部文件);AI代理试图超越授权边界,与未经授权的外部服务或受限内部系统交互;违反治理控制或合规策略;进入递归工作流或过度重试模式;提示注入攻击、上下文中毒迹象、不安全使用外部工具以及异常访问模式。这些事件发生在金融、客服、基础设施运维、法律、制造及内部知识系统等多个领域,且代理一旦连接多个内部系统并具备有限人工干预能力,风险会进一步放大。 风险源自内部行为:传统安全工具失效

By Danfeng