【开源】纯浏览器插件的 browser agent

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社...
【开源】纯浏览器插件的 browser agent
【开源】纯浏览器插件的 browser agent
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
  • 我的帖子已经打上 开源推广 标签:
  • 我的开源项目完整开源,无未开源部分:
  • 我的开源项目已链接认可 LINUX DO 社区:
  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
  • 以上选择我承诺是永久有效的,接受社区和佬友监督:

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出


一个纯浏览器插件形式的 browser agent,能够帮你操作浏览器,比如打开网页、读取内容、点击按钮、填写表单、执行 JavaScript,以及进行基本的逆向分析。

因为是纯插件的形式,所以直接打开就能用,很方便,不需要像 playwright/CDP 那样得有一个后端,而且可以直接操作当前的页面(这也是我做这个插件的原因 :laughing:

image-20260512171011837

AI 自动答题:

image-20260512173131786

还可以用它来进行网页逆向,比如绕过”学某通“视频学习任务的鼠标位置检测

image-20260512172036169

image-20260512172109737

实现的方法也不复杂,其实就是把 content script 的那一套抽象成 function calling ,并且支持注入 Page script。然后 Agent 消息类型和 LLM 流式处理这块借鉴了 pi 的代码进行简化。

目前支持 OpenAI/Anthropic 兼容的 API 格式(比如 DeepSeek、Moonshot,不一定非得是 gpt、claude)

项目地址:GitHub - void5tar/Curio: A Chrome side-panel browser agent · GitHub

欢迎佬友们前来体验和交流!感兴趣的佬有不妨去 Releases 下载玩一下,或者帮忙点点 star :smiling_face_with_three_hearts: 感谢!

1 个帖子 - 1 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文