请教佬们一个问题,有一个商用的agent,对AI 操作浏览器的能力非常强,其实就是类似于Agent browser,但是他们对这个做了极致优化,比如说正常的高自主agent比如cc 配合一个agent browser 可能都需要好多步骤的,他利用云端agent + 四五个工具调用 + 一个浏览器插件可以三四部完成很复杂的操作。稳定、快速。
我最近也在研究,做了很多逆向的工作,大概原理知道,但是这呢都搞不出来人家的那种感觉,他们用的gemini-flash 我用pro 模型都达不到他的少步高能力。当然肯定浏览器插件还是有差距,但是这个都是可以慢慢逆向慢慢"学"的,但是云端的Agent 怎么才能套一下提示词。
Google gemini3 flash
1 个帖子 - 1 位参与者