MobileGym (不是移动健身房)
最近更新了网站内容,现在支持在线体验能够自动操作手机的 gui agent ,大家可以输入自己的 key 来尝试一下,看看 agent 是怎么一步一步完成任务的。我们已经做 sim2real 实验证明了,如果能在网页上完成某个任务,那么大概率在大家手机上也是可以完成的。欢迎大家前来体验,我们会不断的优化网站和代码的问题。我们的最终目标是具有现实世界的生产力和用途,而不是只能在手机或者网页上划几下就不知道该干什么,欢迎大家给我们提建议。(我们其实提供了免费的 key ,大家可以直接在网站使用 agent ,但是用的人多就很可能报错)

有点标题党了,但是真烧了几百亿 Token ,纯前端 TypeScript + React ,实现了 28 个仿真 APP——微信、支付宝、小红书、bilibili 、X 、Reddit 、微信读书、12306 、腾讯会议、Spotify 、eBay , 外加桌面、设置、通讯录、短信、相册、日历、文件、浏览器等系统应用。 桌面兼容小米主题包、支持自定义小组件,Activity 栈、Intent 、手势返回、键盘适配这些 Android 系统机制全部在浏览器里重写了一遍。
虽然本来是为了研究 GUI Agent 打造的,但是 V 友们也完全欢迎来玩啊——可以顺便研究一下安卓系统的一些机制(?我自己也不太懂),或者直接 fork 代码去搞点别的(法律允许范围内)。在线试玩 👉 mobilegym.dev 。
特性 ⚡ 超轻量,高并发,单实例仅占 400M 内存(对比安卓模拟器 4-10G ),单台服务器支持成百上千个环境实例并行 🧪 416 个任务模板,参数化可以生成无限个任务实例,确定性评测,毫秒级出结果,摆脱 LLM as a Judge 的不可靠 🌉 Sim-to-Real 实测有效,在仿真环境用 GRPO 强化学习训练的模型,实测 95% 以上的收益迁移到真机 🧩 扩展友好,文档齐全,新增一个 App 只需要建一个文件夹 + 一份 manifest ;新写一个任务只需要一个 Python 类,最短三行代码搞定 🛡️ 纯沙盒,无后果,不连真服务、不转真钱、不发真消息,放心瞎点 链接 https://github.com/Purewhiter/mobilegym