62天2万星:OpenCLI让AI操控你的浏览器

62天2万星:OpenCLI让AI操控你的浏览器
Photo by Mohamed Nohassi / Unsplash

在AI Agent竞相争夺浏览器控制权的当下,一款名为OpenCLI的开源工具以62天斩获21149颗GitHub星、日均341.1星的爆发式增长证明了市场的饥渴。它并非传统的网页爬虫或API模拟器,而是通过一个轻量级Chrome扩展,让AI Agent直接操控用户的真实浏览器会话——登录态、Cookie、Session全部保留,Agent只需“借用”而非“窃取”凭证。这一设计解决了AI自动化中最棘手的认证墙与反爬机制,将任何网站瞬间降维为命令行界面。

Browser Bridge扩展:AI Agent的“真身”浏览器操控

OpenCLI的核心组件是一个名为Browser Bridge的Chrome扩展。它像一座桥梁,将AI Agent的指令流映射到用户当前登录的浏览器实例上。Agent可以执行导航、点击、填表、提取数据、拦截网络API响应等操作,而一切交互都基于原始的DOM Snapshots(结构化快照)而非屏幕截图——这意味着LLM无需解析像素,直接读取干净的HTML语义。

这种设计的精妙之处在于“登录态复用”:用户的凭证始终留在浏览器中,Agent仅借用会话通道,既绕过了验证码与双重认证,又避免了凭证泄露风险。安装过程极其简洁:

# 安装
npm install -g @jackwener/opencli
# 安装Browser Bridge扩展(Chrome商店ID: ildkmabpimmkaediidaifkhjpohdnifk)
# 验证环境
opencli doctor

让AI Agent操作你的Chrome——不是爬虫,是控制你的真实浏览器。Agent只需一条命令即可完成复杂任务:

npx skills add jackwener/opencli
# 然后告诉Agent:“帮我查一下小红书通知”

100+ Site Adapters与Zero LLM Cost:结构化的确定性自动化

OpenCLI并非只提供通用控制能力,它内置了超过100个面向特定网站的适配器(Adapter)。这些适配器是确定性的(deterministic)——不依赖LLM调用,不消耗token,直接返回结构化数据(JSON/CSV)。这是它与其他Browser Automation方案的根本区别:大多数方案需要LLM解析页面并推测意图,而OpenCLI的Adapter直接封装了目标网站的DOM提取逻辑。

opencli bilibili hot --limit 5
opencli hackernews top --limit 5
opencli twitter trending
opencli xiaohongshu search "AI" --limit 10
opencli reddit hot opencli zhihu hot
opencli 1688 search "手机壳"
opencli amazon search "laptop"

支持的站点涵盖了Twitter/X、Reddit、HackerNews、Bilibili、小红书、知乎、WeChat、1688、Weibo、Google Scholar、Baidu Scholar、Nowcoder等海内外主流平台。这种“零LLM成本”的设计使得批量数据采集、定时监控、竞品分析等任务可以以极低的边际成本运行,对于需要高频操作的企业用户而言意义重大。

从终端到桌面:CLI Hub与Electron应用的无缝集成

OpenCLI不仅能够操作网页,更是一个统一的CLI Hub——它将本地开发工具与命令行服务通过同一套接口暴露给Agent。例如:

opencli gh pr list --limit 5
opencli docker ps
opencli obsidian search query="AI"
opencli longbridge quote TSLA.US --format json

支持的工具涵盖gh、docker、obsidian、longbridge、ntn、lark-cli、tg、discord、wx等,将本地终端命令也纳入了Agent的操控范围。更进一步,OpenCLI还能通过CDP(Chrome DevTools Protocol)直接控制Electron桌面应用——Cursor、Codex、ChatGPT、Antigravity、Doubao等主流GPT客户端均在支持之列。这意味着AI Agent可以从命令行直达桌面GUI,实现真正的跨平台操控闭环。

Read more

阿里免费高考志愿Agent上线

阿里免费高考志愿Agent上线

2026年高考落下帷幕,志愿填报这一决定考生命运的关键环节,正在被AI Agent技术彻底重塑。面对1290万考生、近3000所高校与2000多个专业构成的庞大选择迷宫,传统的被动式问答Chatbot已显力不从心。阿里巴巴旗下的千问近日宣布,推出国内首个全周期高考志愿填报Agent,并面向全国考生免费开放。这款产品不仅能够主动规划、持久记忆用户偏好,更通过40万“AI考生”的对抗压测,将志愿规划师的专业经验沉淀进了模型底层。从知识库构筑、对抗强化学习到动态方案生成,千问正试图用AI弥合长期存在的高考信息鸿沟,让每一位考生都能享受公平而专业的选择权。 Agent入场:从“被动应答”到“主动规划”的范式革命 千问高考志愿Agent的上线,标志着AI在复杂决策场景中的进化。与聊天机器人不同,Agent具备三大核心能力:持久记忆,能记住用户说过的每一句话;主动规划,如自动生成“志愿日历”提醒关键时间节点;实时工具调用与反思,让回答更加精准。以北京一位660分、理化生选科、目标人工智能专业的考生为例,Agent在接收填写的省份、成绩、专业偏好乃至MBTI性格类型后,自动生成包含院校推荐、专

By Danfeng
科大讯飞发布SpaceMind

科大讯飞发布SpaceMind

2026年6月10日,科大讯飞在其英文名iFLYTEK于香港举办的全球发布会上,正式推出智慧空间Agentic架构SpaceMind。这一架构标志着人工智能Agent从虚拟数字世界加速迈入物理空间,赋予楼宇、家居等实体环境以自主思考、真实记忆与自学习能力。SpaceMind通过60GHz毫米波雷达实现5厘米级精准定位,并采用双模型协同架构将设备指令响应速度压缩至700毫秒以内,能够实时感知用户需求与环境变化,主动联动各类设备提供个性化服务。此举不仅巩固了科大讯飞在AI软硬一体战略中的技术护城河,也为智慧空间行业树立了新的交互基准。 60GHz毫米波雷达与双模型协同:重新定义空间感知精度 SpaceMind的核心技术突破在于其感知层与决策层的协同设计。根据发布会披露,该架构搭载60GHz毫米波雷达,能够实现5厘米级的室内定位精度,远超传统蓝牙或Wi-Fi方案的米级误差。在决策层面,双模型协同架构将设备指令的响应速度提升至700毫秒以内,这意味着用户在物理空间中的一举一动——从走进房间到语音指令发出——系统均能在亚秒级内完成感知、理解与设备联动。这种低延迟、高精度的交互能力,使Spa

By Danfeng
GitHub和Hugging Face创始人注资AI代理初创Zaro

GitHub和Hugging Face创始人注资AI代理初创Zaro

总部位于伦敦的初创公司Zaro成功完成510万美元融资,由知名风投Cherry Ventures领投,并罕见地获得了代码托管巨头GitHub联合创始人Thomas Dohmke与开源AI平台Hugging Face联合创始人Thomas Wolf的个人背书。这笔投资不仅点燃了AI Agent(智能体)赛道的新热度,更揭示了行业正在从“通用聊天机器人”加速迈向“定制化数字劳动力”的关键拐点。 硅谷传奇创始人押注,企业级AI Agent从“演示”到“部署” Zaro的创始团队由Tommy Barav领导,他此前是AI初创公司Lovable(原名GPT Engineer)的增长顾问。该公司提供的核心服务是帮助客户构建定制化的AI Agent,其目标市场直指企业自动化中尚未被完全开发的“灰色地带”。据Zaro透露,其技术栈能够将AI Agent从单纯的对话工具升级为能够独立执行复杂业务流程的“虚拟员工”。本次融资的投资者阵容星光熠熠,GitHub的Dohmke和Hugging Face的Wolf以“天使投资人”身份加入,此外还有Spotify早期高管Petter Carlsson和马士基

By Muhuai
代理AI引爆700亿安全市场重塑

代理AI引爆700亿安全市场重塑

全球网络安全市场在2026年第一季度突破70亿美元大关,同比增长14%,这一稳健增长背后隐藏着更深层的结构性变革:Agentic AI(自主人工智能)时代的到来正逼迫企业重新设计安全架构。Dell'Oro Group最新报告揭示,传统硬件安全设备正被抛弃,软件定义、云原生平台成为投资重镇。企业不仅要保护人类员工,还要为数十亿自主决策的“AI数字员工”建立行为护栏,一个全新的安全市场逻辑正在诞生。 70亿美元安全市场爆发:Agentic AI驱动转型 2026年第一季度的网络安全支出创下历史新高,但Dell'Oro Group分析师Mauricio Sanchez指出:“物理防火墙和单一产品并未消失,但Agentic AI时代正在提升软件和云原生安全平台的价值。”这份报告的核心洞察是,企业不再购买“更多相同的东西”,而是大规模从硬件安全向集成化、软件定义的平台迁移。市场增长的核心驱动力来自企业急需为自主非人类行为体(AI代理)建立数字护栏,这直接推动了特定云原生安全领域的爆发式增长。 政策平面扩张:SSE增长22%,WAF增长20% 传统“有边界可防御”的安全模型已被抛弃,取

By Danfeng