嗯嗯
放松放松
放松放松
Latest
在AI推理需求爆发和智能体规模化部署的背景下,谷歌云于年度开发者大会上宣布重大战略转向,推出两款第八代TPU芯片——专为训练优化的TPU 8T和面向推理场景的TPU 8i,首次将训练与推理任务拆分至独立芯片。此举旨在降低推理成本、提升能效比,并支撑企业AI智能体的全面铺开。同时,谷歌发布Gemini企业级智能体平台,补齐记忆与协作短板,直指OpenAI和Anthropic在企业市场的竞争格局。这一硬件与软件的双线出击,标志着谷歌正以算力重构和应用层卡位,正面冲击英伟达主导的AI芯片市场。 训练与推理分离,芯片性能大幅跃升 谷歌将第八代TPU拆分为两款独立产品,是对AI工作负载分化趋势的直接回应。TPU 8T专为AI模型训练优化,号称能将前沿模型开发周期从数月压缩至数周,每瓦性能较上一代提升124%,在同等价格下性能比第七代TPU提升2.8倍。TPU 8i则面向推理场景,每瓦性能提升117%,性能比上一代提升80%,集成384MB的SRAM,是上一代的三倍,以减少数据外部调取,支持多步骤推理任务。两款芯片均计划于2026年晚些时候上市,旨在以成本效益方式提供大规模吞吐量和低延迟。
Latest
在人工智能技术重塑全球制药行业的浪潮中,默克与谷歌云近日宣布达成一项价值高达10亿美元的多年代理式AI合作协议,标志着大型药企正以前所未有的规模拥抱AI驱动的数字化转型。这项协议不仅涉及巨额资金投入,更旨在将代理式AI平台深度整合到默克的研发、制造、商业及企业运营全链条中,以加速科学突破转化为患者可及的治疗方案。此举反映了生物制药领域正进入一场由AI技术驱动的“军备竞赛”,旨在通过数据分析和自动化工具缩短药物开发周期,提升竞争力,同时也引发了关于数据安全、治理和行业格局变化的深度思考。 核心合作细节与战略意图 根据协议,默克与谷歌云将共同构建一个“AI赋能的企业”,谷歌云工程师将与默克团队紧密合作,部署包括Gemini Enterprise在内的AI技术。默克首席信息与数字官Dave Williams表示,AI代理和生成式工具将帮助全球团队重新构想规模化流程,更快地将科学突破带给患者。默克发言人强调,人类健康是一个数据复杂度极高的问题,此次合作代表了技术如何支持从早期发现到商业执行的整个制药价值链的根本性转变。协议价值高达10亿美元,凸显了默克对AI基础设施的长期承诺。 行业
在生产环境中测试AI智能体,传统通过/失败测试几乎毫无用处。最新预印本研究显示,17.14%的智能体故障是步骤重复,13.98%是推理与动作失配——这两类错误均能绕过最终输出检查。本报告对比评测了Braintrust、Arize Phoenix、Promptfoo、Galileo以及Augment Code的Cosmos五款主流评估工具,并揭示了一个行业盲区:团队发现故障后,修复经验往往困在个人配置里,下周另一名同事会重新经历同一故障。Cosmos正是为了解决这一“后评估复用”问题而设计,通过学习飞轮将一次性修正转化为团队共享记忆。 传统测试的六大盲区 LLM驱动的智能体打破了确定性输出假设:同一语义正确的答案可能以数十种语法形式出现,字符串匹配检查会立刻失效。本报告归纳出六种传统测试完全遗漏的失效模式: * 输出变异性:语义正确但表达方式不同,字符串匹配拒绝通过。 * 错误级联:单步中间错误污染后续推理,终点测试只检查最终状态。 * 错误工具路径:通过错误工具或不安全序列得到正确结果,输出验证忽略执行路径。 * 行为漂移:模型提供者更新后智能体性能下降,静态测试套件仍
在东南亚半导体产业成为全球新增长极的背景下,格创东智携全栈CIM解决方案与工业AI智能体集群亮相2026 SEMICON SOUTHEAST ASIA,系统性地展示了其如何通过AI技术破解制造中的数据孤岛、工艺黑箱与被动运维三大核心痛点,为区域智能制造升级提供了一条可量化的数字化路径。 全栈CIM与AI智能体集群:破解半导体制造三大核心痛点 格创东智在展会上推出的全栈CIM解决方案,覆盖从计划到执行的智能制造全流程,其核心在于通过预置模板与仿真平台缩短系统导入周期,并确保生产连续性。针对数据孤岛、工艺黑箱与被动运维这三大行业痛点,格创东智主张通过AI Agent集群实现数据治理、过程智能控制与预测性维护,有效提升良率、设备效率及灵活性。 四大域智能体集群:从概念到落地的硬核实力 * 生产域:Full-stack CIM方案提供包含MES制造执行系统及多种智能应用的集成架构,其CIM AI Foundation平台打通MES、EAP、FDC等多类数据源,构建统一数据湖,使良率分析、设备预测性维护等AI应用实现模块化、低门槛构建。 * 设备域:设备智能Agent方案整合多源
在近日举办的新紫光集团创新峰会上,紫光展锐(UNISOC)正式发布4nm制程的端边AI芯片平台N9系列,以及配套的Agentic AI底座技术平台。此举标志着中国半导体企业正从芯片硬件向“算力+智能体”全栈式解决方案转型,为物联网、边缘计算和智能终端市场注入以Agentic AI为核心的新变量。 4nm与Arm v9.2架构:N9系列的技术硬核 N9系列采用“归一架构+灵活扩展”设计,通过模块化算力单元覆盖轻量级物联网至高性能边缘计算场景。关键性能数据包括:客户物料清单(BOM)成本降低39%,开发周期缩短67%。该平台集成Swap Ultra交换引擎优化小内存场景,并配备自研UniLLM GenAI音频处理模块与UniClaw智能体框架,在多媒体与AI交互上形成差异化优势。内置芯片级安全体系可覆盖金融支付、工业控制等高安全需求场景。 Agentic AI底座:从被动响应到主动服务的范式跃迁 同步发布的Agentic AI底座技术平台整合原生AI算力架构、智能体运行框架与全场景开发工具链。通过芯片级算力调度和跨领域知识融合,终端设备可实现环境感知、自主决策与任务执行能力。现
近期,雪球平台上一场关于MongoDB在AI时代护城河强度的讨论引发业内关注。一方观点认为,开源数据库遍地、云厂商自研产品对外服务、LangChain热度消退,技术迭代极快,MongoDB壁垒薄弱;另一方则从企业级部署、替换周期、AI生态绑定等角度反驳,指出低端平替无法撼动高端刚需。这场争论折射出投资人对于“软件基础设施”价值的认知分歧——真相究竟如何?本文基于产业真实落地现状,逐层拆解双方逻辑,还原MongoDB的核心竞争格局。 数据库门槛:从“能做”到“企业级可用”的鸿沟 反对者称“AI时代数据库门槛太低,开源一大堆”,但企业级商用数据库的门槛远非“能用”那么简单。调研显示,开发一个可运行的开源文档数据库,大学团队即可完成;但要支撑高并发不宕机、数据不丢失、全球多节点部署、原生向量检索、AI Agent多轮会话与长期记忆、完善的企业安全审计与运维工具,是“地狱级”难度。开源项目往往只能满足小作坊级场景,而AI初创公司与中大型企业在构建复杂Agent应用时,选型首要标准仍是稳定性和生态完备性,MongoDB Atlas因此成为默认选择。 云厂商兼容版:
全球AI领域正迎来一场划时代的范式转移:以观察、规划、决策、行动和自反馈为核心的“代理型AI”(Agentic AI)正在从传统的被动式聊天机器人跃升为具备自主工作流与持续进化的智能体。业内观点认为,这种能够自动监控结果并自我优化的AI架构,将从根本上取代目前依赖用户手动操作的传统应用程序,开启真正意义上的自动化纪元。 自主AI代理的核心架构:从观察到自我改进 根据最新发布的技术分析,Agentic AI与现有AI工具的最大区别在于其闭环能力。当前大多数AI工具仅能被动响应人类输入的提示词(prompt),而代理型AI则能自主执行完整的“OODA循环”(Observe观察、Orient定位、Decide决策、Act行动),并通过内置的反馈回路(Feedback Loops)监控执行结果,从数据中持续学习以优化下一次的规划与目标设定。这一架构正是下一代大语言模型(LLM)系统、自主工作流和高级AI代理的技术基础。 从被动响应到主动执行:Agentic AI如何颠覆应用范式 这种“感知-思考-行动-学习”的闭环能力,意味着AI不再局限于回答问题或生成文本,而是可以独立完成诸如供
随着AI产业从模型训练迈向智能体(Agentic AI)应用,CPU芯片意外成为继GPU之后的最强算力瓶颈。涨价、缺货、交货周期拉长已成常态,AMD、Intel、Arm等巨头数据中心业务纷纷爆发,服务器CPU需求呈指数级增长,一场围绕CPU核心地位的市场争夺战已然打响。 三大芯片巨头财报亮眼:数据中心CPU需求爆发 最新财报数据印证了CPU市场的迅猛势头。AMD 2026财年第一财季营收102.53亿美元,同比增长38%,数据中心业务贡献58亿美元,同比大增57%,主要受EPYC系列处理器需求驱动。Intel同期营收136亿美元,同比增7%,数据中心与AI(DCAI)业务收入51亿美元,同比增22%,成为整体业绩提升的关键引擎。Arm则在第四财季创下14.9亿美元营收新高,数据中心版税收入同比翻倍,其AGICPU芯片已累计获得超20亿美元订单,数据中心业务有望成为其最大收入板块。 涨价缺货成常态:CPU成AI算力新瓶颈 AI从训练转向推理与智能体应用后,CPU在任务编排、数据管理、安全控制等环节变得不可替代。服务器中CPU与GPU配比正从1:8向1:4趋近,CPU需求提升至
智东西5月10日报道,由Nous Research开发的开源自进化AI Agent产品Hermes(昵称“爱马仕”)在OpenRouter平台上的日Token消耗量飙升至2710亿,首次超越此前长期霸榜的OpenClaw(昵称“龙虾”),登顶全球应用调用量榜首。值得注意的是,小米旗下模型MiMo-V2-Pro成为贡献调用量最大的单一模型,国产模型阶跃星辰、腾讯等也位列前五。这一拐点标志着AI Agent行业已从模型参数的“军备竞赛”正式转入真实使用量的较量阶段,开源Agent正以前所未有的速度挑战闭源和垂直代码助手产品。 Hermes Agent日消耗271B Token登顶,小米MiMo贡献第一 根据OpenRouter最新Token消耗榜,Hermes在5月9日的单日Token消耗量达到271B(约2710亿Token),远超第二名OpenClaw的245B、第三名Kilo Code的149B以及第四名Claude Code的79.2B。此前于4月14日,Hermes首次冲上“最热门编程Agent”细分榜第一,但未登顶总榜;不到一个月后,它便在实打实的日调用量上超越龙虾。目前
2026年4月末,SAP悄然发布了其API政策4/2026版本(Section 2.2.2),这被视为今年最具影响力的企业AI治理文件。该条款明确禁止通过非SAP认可的架构使用API与半自主或生成式AI系统进行交互,尤其针对能够自主规划、选择和执行API调用序列的“附加AI”。此举不仅重塑了企业AI代理的架构边界,更在客户社区引发关于锁定、合规与开放性的激烈讨论。本文深度剖析政策细则、五大解读、与微软/赛富时等竞品的对比,以及客户和合作伙伴必须立即采取的行动。 Section 2.2.2 真实含义:禁止计划、选择或执行API调用序列的AI 条款直白禁止通过SAP认可的架构、数据服务或特定服务路径之外的任何方式,将API用于与半自主或生成式AI系统的交互或集成。同时明确禁止数据抓取、大规模提取。唯有SAP商务加速器中心或产品文档中列出的已发布API方可使用,且必须用于其记录的目的。任何代理性使用都必须经由SAP认可的路径。政策保留限流、暂停甚至终止访问的执行权利,并禁止通过代理、中间服务、自定义代码或模拟身份进行规避。 社区五大解读:从技术封闭到商业锁定的多棱镜 * 技术封
在AI Agent从概念验证迈向规模化落地的关键节点,易点天下近日公开了其在Agentic AI工程化领域的前沿实践。这家深耕出海营销的技术服务商,正通过上下文工程(Context Engineering)、多云基础设施与分层安全治理体系的协同创新,试图破解AI Agent在企业场景中“落地难、管理乱、风险高”的行业痛点。其基于Cycor平台构建的多云架构,已整合AWS、Google Cloud、阿里云、腾讯云、华为云等主流云服务,为AI Agent的规模化部署提供了底层基座。 六层上下文体系:从“记忆”到“技能”的工程化突围 易点天下将技术重心转向“Context Engineering”,构建起覆盖会话记忆、短期记忆、长期知识、知识图谱、经验库与组织技能库的六层上下文结构。该体系通过主动注入机制,在敏感操作或异常处理前自动调取历史信息与风险数据,显著提升AI Agent对复杂业务场景的感知与决策能力。同时,公司引入分层Token治理与渐进式工具加载机制,旨在优化推理效率并提高工具调用的准确率。 五层安全防御机制:为AI自动化操作“上锁” 为应对AI自动化操作在生产环境中