62天2万星:OpenCLI让AI操控你的浏览器
在AI Agent竞相争夺浏览器控制权的当下,一款名为OpenCLI的开源工具以62天斩获21149颗GitHub星、日均341.1星的爆发式增长证明了市场的饥渴。它并非传统的网页爬虫或API模拟器,而是通过一个轻量级Chrome扩展,让AI Agent直接操控用户的真实浏览器会话——登录态、Cookie、Session全部保留,Agent只需“借用”而非“窃取”凭证。这一设计解决了AI自动化中最棘手的认证墙与反爬机制,将任何网站瞬间降维为命令行界面。
Browser Bridge扩展:AI Agent的“真身”浏览器操控
OpenCLI的核心组件是一个名为Browser Bridge的Chrome扩展。它像一座桥梁,将AI Agent的指令流映射到用户当前登录的浏览器实例上。Agent可以执行导航、点击、填表、提取数据、拦截网络API响应等操作,而一切交互都基于原始的DOM Snapshots(结构化快照)而非屏幕截图——这意味着LLM无需解析像素,直接读取干净的HTML语义。
这种设计的精妙之处在于“登录态复用”:用户的凭证始终留在浏览器中,Agent仅借用会话通道,既绕过了验证码与双重认证,又避免了凭证泄露风险。安装过程极其简洁:
# 安装
npm install -g @jackwener/opencli
# 安装Browser Bridge扩展(Chrome商店ID: ildkmabpimmkaediidaifkhjpohdnifk)
# 验证环境
opencli doctor
让AI Agent操作你的Chrome——不是爬虫,是控制你的真实浏览器。Agent只需一条命令即可完成复杂任务:
npx skills add jackwener/opencli
# 然后告诉Agent:“帮我查一下小红书通知”
100+ Site Adapters与Zero LLM Cost:结构化的确定性自动化
OpenCLI并非只提供通用控制能力,它内置了超过100个面向特定网站的适配器(Adapter)。这些适配器是确定性的(deterministic)——不依赖LLM调用,不消耗token,直接返回结构化数据(JSON/CSV)。这是它与其他Browser Automation方案的根本区别:大多数方案需要LLM解析页面并推测意图,而OpenCLI的Adapter直接封装了目标网站的DOM提取逻辑。
opencli bilibili hot --limit 5
opencli hackernews top --limit 5
opencli twitter trending
opencli xiaohongshu search "AI" --limit 10
opencli reddit hot opencli zhihu hot
opencli 1688 search "手机壳"
opencli amazon search "laptop"
支持的站点涵盖了Twitter/X、Reddit、HackerNews、Bilibili、小红书、知乎、WeChat、1688、Weibo、Google Scholar、Baidu Scholar、Nowcoder等海内外主流平台。这种“零LLM成本”的设计使得批量数据采集、定时监控、竞品分析等任务可以以极低的边际成本运行,对于需要高频操作的企业用户而言意义重大。
从终端到桌面:CLI Hub与Electron应用的无缝集成
OpenCLI不仅能够操作网页,更是一个统一的CLI Hub——它将本地开发工具与命令行服务通过同一套接口暴露给Agent。例如:
opencli gh pr list --limit 5
opencli docker ps
opencli obsidian search query="AI"
opencli longbridge quote TSLA.US --format json
支持的工具涵盖gh、docker、obsidian、longbridge、ntn、lark-cli、tg、discord、wx等,将本地终端命令也纳入了Agent的操控范围。更进一步,OpenCLI还能通过CDP(Chrome DevTools Protocol)直接控制Electron桌面应用——Cursor、Codex、ChatGPT、Antigravity、Doubao等主流GPT客户端均在支持之列。这意味着AI Agent可以从命令行直达桌面GUI,实现真正的跨平台操控闭环。