AI治理关键:从Agent事件看风险与框架

AI治理关键:从Agent事件看风险与框架
Photo by Ant Rozetsky / Unsplash

随着人工智能技术的飞速发展,AI智能助手(AI Agent)正从概念走向现实,为企业与个人用户带来前所未有的效率提升。然而,近期一款于2025年推出的开源AI Agent在广泛采用后,暴露出一系列潜在风险,包括系统漏洞、非预期操作行为及敏感资料处理问题,引发监管机构如香港数字政策办公室和个人资料私隐专员公署的警示。这一事件突显了在AI应用日益普及的背景下,建立清晰且一致的AI管治机制对企业及整体社会的紧迫性。本文将深入探讨AI Agent的核心风险、管治框架的关键要素,以及如何借鉴国际标准来构建负责任的AI生态系统。

AI Agent概览及已披露的主要风险

与主要用于对话的AI聊天机器人不同,AI Agent的核心设计在于“执行行动”,能够根据指令自主完成任务,并与外部工具如即时通讯软件、电子邮件系统、网上银行等高敏感度系统整合。其“长期记忆”能力和可扩充的“技能”模组,使其在个人及企业环境中被广泛应用,例如自动分类电子邮件、草拟回覆内容,以及整合AI代码助理以加速软件开发。

然而,为执行这些行动,用户需授予AI Agent高度系统权限和敏感资讯,如电邮帐户凭证,这显著扩大了潜在风险面。自推出约六个月后,使用者开始反映技术层面的问题,包括漏洞(如CVE‑2026‑25253)、非预期结果(如重要电邮被删除),以及敏感资料处理疑问。这些风险促使部分企业重新评估AI Agent的可靠性,并引发监管机构的关注。

代理式AI趋势与管治的关键角色

AI Agent的应用反映了AI发展的新阶段,使用者正探索更高自主程度的系统。在实际情境中,AI的角色可能从辅助执行延伸至承担更多任务,而管治架构在此过程中扮演关键推动力。企业引入AI Agent时,需通过合适的管理与制度安排来支持其使用,确保安全与合规。

安全引入AI Agent前,企业必须考虑多个关键管治层面,包括:

  • AI角色与职责:清晰界定企业、高层、营运部门及员工的责任。
  • 问责机制:明确AI Agent行为的最终问责人,机器本身不承担法律责任。
  • 合规:确保全生命周期符合相关AI法例,如《EU AI Act》。
  • 风险评估:系统化识别潜在风险,并制定控制措施。
  • 负责任的AI开发:确保公平性、稳健性、安全性、隐私及数据管理。
  • 可信度核查:审及核查大型语言模型是否可靠、不歧视且可预测。
  • 人为监督:明确哪些任务可全自动执行,哪些必须有人为覆核。
  • 透明度:确保决策与行动有纪录、可追溯且具解释性。
  • 持续监察:建立即时监察机制,确保AI Agent在动态环境中保持预期表现。
  • 事故应对:制定通报、应变及检讨机制。

AI管治框架与最佳实践指引

回应AI管治需求是一个长期过程,需要企业持续建立和完善架构。鉴于企业规模、行业属性及应用情境各异,不存在“一体适用”的模式。业界已发展出多项权威国际标准与框架,为企业提供实务指引:

  • 《欧盟人工智能法案》(EU AI Act):全球首个具全面性及法律约束力的AI法规框架,采用风险导向管理模式,禁止“不可接受风险”的应用,并对“高风险AI系统”施加严格管治义务。
  • ISO/IEC 42001:2023:全球首个可认证的人工智能管理体系国际标准,为企业建立系统化方法,涵盖风险管理、伦理考量及合规要求,并通过第三方认证展示承诺。
  • NIST AI风险管理框架(AI RMF):由美国国家标准与技术研究院发布的自愿性框架,协助企业在全生命周期内系统化识别、评估、管理及监察风险,强调可信度、透明度及问责性。

总结

AI Agent事件揭示了自主型AI在实际应用中的多重面向,既带来业务可能,也提出管理、风险与责任分工的课题。通过参考EU AI Act、ISO/IEC 42001:2023及NIST AI RMF等框架,企业可建立系统化的管治安排。展望未来,随着AI技术持续演进,定期检视及调整管治框架将有助于企业回应新情况,支持AI系统在持份者关注下的持续应用。如要了解更多详情,可浏览SGS TIC Mall网站。

Read more

阿里免费高考志愿Agent上线

阿里免费高考志愿Agent上线

2026年高考落下帷幕,志愿填报这一决定考生命运的关键环节,正在被AI Agent技术彻底重塑。面对1290万考生、近3000所高校与2000多个专业构成的庞大选择迷宫,传统的被动式问答Chatbot已显力不从心。阿里巴巴旗下的千问近日宣布,推出国内首个全周期高考志愿填报Agent,并面向全国考生免费开放。这款产品不仅能够主动规划、持久记忆用户偏好,更通过40万“AI考生”的对抗压测,将志愿规划师的专业经验沉淀进了模型底层。从知识库构筑、对抗强化学习到动态方案生成,千问正试图用AI弥合长期存在的高考信息鸿沟,让每一位考生都能享受公平而专业的选择权。 Agent入场:从“被动应答”到“主动规划”的范式革命 千问高考志愿Agent的上线,标志着AI在复杂决策场景中的进化。与聊天机器人不同,Agent具备三大核心能力:持久记忆,能记住用户说过的每一句话;主动规划,如自动生成“志愿日历”提醒关键时间节点;实时工具调用与反思,让回答更加精准。以北京一位660分、理化生选科、目标人工智能专业的考生为例,Agent在接收填写的省份、成绩、专业偏好乃至MBTI性格类型后,自动生成包含院校推荐、专

By Danfeng
科大讯飞发布SpaceMind

科大讯飞发布SpaceMind

2026年6月10日,科大讯飞在其英文名iFLYTEK于香港举办的全球发布会上,正式推出智慧空间Agentic架构SpaceMind。这一架构标志着人工智能Agent从虚拟数字世界加速迈入物理空间,赋予楼宇、家居等实体环境以自主思考、真实记忆与自学习能力。SpaceMind通过60GHz毫米波雷达实现5厘米级精准定位,并采用双模型协同架构将设备指令响应速度压缩至700毫秒以内,能够实时感知用户需求与环境变化,主动联动各类设备提供个性化服务。此举不仅巩固了科大讯飞在AI软硬一体战略中的技术护城河,也为智慧空间行业树立了新的交互基准。 60GHz毫米波雷达与双模型协同:重新定义空间感知精度 SpaceMind的核心技术突破在于其感知层与决策层的协同设计。根据发布会披露,该架构搭载60GHz毫米波雷达,能够实现5厘米级的室内定位精度,远超传统蓝牙或Wi-Fi方案的米级误差。在决策层面,双模型协同架构将设备指令的响应速度提升至700毫秒以内,这意味着用户在物理空间中的一举一动——从走进房间到语音指令发出——系统均能在亚秒级内完成感知、理解与设备联动。这种低延迟、高精度的交互能力,使Spa

By Danfeng
GitHub和Hugging Face创始人注资AI代理初创Zaro

GitHub和Hugging Face创始人注资AI代理初创Zaro

总部位于伦敦的初创公司Zaro成功完成510万美元融资,由知名风投Cherry Ventures领投,并罕见地获得了代码托管巨头GitHub联合创始人Thomas Dohmke与开源AI平台Hugging Face联合创始人Thomas Wolf的个人背书。这笔投资不仅点燃了AI Agent(智能体)赛道的新热度,更揭示了行业正在从“通用聊天机器人”加速迈向“定制化数字劳动力”的关键拐点。 硅谷传奇创始人押注,企业级AI Agent从“演示”到“部署” Zaro的创始团队由Tommy Barav领导,他此前是AI初创公司Lovable(原名GPT Engineer)的增长顾问。该公司提供的核心服务是帮助客户构建定制化的AI Agent,其目标市场直指企业自动化中尚未被完全开发的“灰色地带”。据Zaro透露,其技术栈能够将AI Agent从单纯的对话工具升级为能够独立执行复杂业务流程的“虚拟员工”。本次融资的投资者阵容星光熠熠,GitHub的Dohmke和Hugging Face的Wolf以“天使投资人”身份加入,此外还有Spotify早期高管Petter Carlsson和马士基

By Muhuai
代理AI引爆700亿安全市场重塑

代理AI引爆700亿安全市场重塑

全球网络安全市场在2026年第一季度突破70亿美元大关,同比增长14%,这一稳健增长背后隐藏着更深层的结构性变革:Agentic AI(自主人工智能)时代的到来正逼迫企业重新设计安全架构。Dell'Oro Group最新报告揭示,传统硬件安全设备正被抛弃,软件定义、云原生平台成为投资重镇。企业不仅要保护人类员工,还要为数十亿自主决策的“AI数字员工”建立行为护栏,一个全新的安全市场逻辑正在诞生。 70亿美元安全市场爆发:Agentic AI驱动转型 2026年第一季度的网络安全支出创下历史新高,但Dell'Oro Group分析师Mauricio Sanchez指出:“物理防火墙和单一产品并未消失,但Agentic AI时代正在提升软件和云原生安全平台的价值。”这份报告的核心洞察是,企业不再购买“更多相同的东西”,而是大规模从硬件安全向集成化、软件定义的平台迁移。市场增长的核心驱动力来自企业急需为自主非人类行为体(AI代理)建立数字护栏,这直接推动了特定云原生安全领域的爆发式增长。 政策平面扩张:SSE增长22%,WAF增长20% 传统“有边界可防御”的安全模型已被抛弃,取

By Danfeng