[分享创造] 分析了 Browser MCP、CodeX、Kimi WebBridge 后,我做了一个增强版的开源 AI Agent 浏览器控制实现

最近看了几个 AI 控制浏览器的方案,各自都有些不太满意的地方: CodeX:经常开全新窗口,没有登录态。 Playwright MCP:想继承登录态得额外,步骤多。 Kimi WebBridge:功能做得不错,但闭源。 总感觉这玩意儿我上我也行,于是自己写了一个: OpenBridge 。 和上面...
[分享创造] 分析了 Browser MCP、CodeX、Kimi WebBridge 后,我做了一个增强版的开源 AI Agent 浏览器控制实现
[分享创造] 分析了 Browser MCP、CodeX、Kimi WebBridge 后,我做了一个增强版的开源 AI Agent 浏览器控制实现

最近看了几个 AI 控制浏览器的方案,各自都有些不太满意的地方:

总感觉这玩意儿我上我也行,于是自己写了一个:OpenBridge

和上面几个的主要区别:

  • 直接复用你当前 Chrome 的登录态,不用重新登录

  • 完全开源,Cookie 这种敏感数据全在本地,不经过任何外部服务

  • 标准 MCP 协议 + 本地 HTTP API ,不绑定客户端

额外做的一些增强:

  • 支持 AI 自动给标签页重命名 ID ,方便管理

  • 一键关闭浏览器标签

  • AI 控制开关,不想让它操作的时候可以直接关掉

  • MCP 和 HTTP API 双接口支持

安装很简单:

Chrome 开发者模式加载一下已打包好的 zip 扩展就行了 : https://github.com/60ke/openBridge/releases#:~:text=openbridge%2Dextension%2Dchrome%2Dv0.1.0.zip Chrome 商店上架正在审核中,后续可以直接从商店安装。

然后直接让 Claude Code 、CodeX 、Kimi 、OpenCode 甚至 Trace 帮你跑这条命令:

帮我安装:curl -fsSL https://raw.githubusercontent.com/60ke/openBridge/master/install.sh | bash

顺便说一个其中的一个好处: 可以通过网页直接调 Gemini 、ChatGPT 这些 AI 的生图能力,不占用你 Coding 工具的额度。

最后放 ai agent 调用 gemini 生成图片的效果图:

db1e33cf4c22a7a1372a3b3f080e3602 01_openbridge_ai_browser_control_1280x800

仓库地址: https://github.com/60ke/openBridge

来源: v2ex查看原文