为了让 Agent 直接操作我的本地 Chrome,我做了个 Browser Relay

一言以蔽之,现在还没有能让 Agent 操作我的浏览器的方案 比如很多时候我想让 Agent 帮我看一个网页、点几个按钮、抓一下登录后的内容,结果就会遇到这些问题: Playwright / Puppeteer 默认是一个全新的浏览器环境,没有我的登录态。 云浏览器就不用说了,完全没用 有些网站就是...
为了让 Agent 直接操作我的本地 Chrome,我做了个 Browser Relay
为了让 Agent 直接操作我的本地 Chrome,我做了个 Browser Relay

一言以蔽之,现在还没有能让 Agent 操作我的浏览器的方案

比如很多时候我想让 Agent 帮我看一个网页、点几个按钮、抓一下登录后的内容,结果就会遇到这些问题:

  • Playwright / Puppeteer 默认是一个全新的浏览器环境,没有我的登录态。
  • 云浏览器就不用说了,完全没用

有些网站就是只有你本机 Chrome 里才是完整可用的:cookie、localStorage、扩展、登录态,全都在里面。之前尝试过几个项目:

  • openclaw-broswer-relay: 可以做到,但是只有 openclaw 能用
  • dotobot: 可以做到但是要连接别人服务器,而且只能读,不能操作浏览器
  • agent-reach: 专注于获取信息,而不是操作浏览器
  • opencli/opencli-rs: 把网站 cli 化,但很多时候我要的不是反复操作某个网页,就是要临时用各个网页

所以我做了个小东西,叫 Browser Relay

它的作用很简单:把你本机 Chrome 接给任意 AI Agent

架构大概是这样:

任意 AI Agent
    ↓ HTTP API / MCP
本机 Relay Server
    ↓ WebSocket
Chrome Extension
    ↓ CDP
你的真实 Chrome 标签页

它能做这些事:

  • 读取当前网页内容,输出成 Agent 友好的文本快照
  • 点击按钮、输入文字、提交表单
  • 滚动页面、截图
  • 执行 JS
  • 保留你的真实浏览器登录态、cookie、localStorage、扩展环境

也就是说,Claude Code、Cursor、Codex、Windsurf,或者你自己写的 Agent,只要能调 HTTP 都能用。为此我还专门提供了 skills。

使用分三步,先安装:

npm install -g @linsoai/browser-relay
browser-relay status

安装 Chrome 扩展:

browser-relay path
chrome://extensions
打开开发者模式
Load unpacked
选择 browser-relay 的 extension 目录

安装 skill,根据提示执行 npx skills 命令安装到对应的 agent 里:

browser-relay skill

然后就可以愉快地让 agent 操作你自己的浏览器了

11 个帖子 - 5 位参与者

阅读完整话题

来源: linux.do查看原文