【开源推广】烧了几百亿 token,写了个运行在浏览器里的安卓系统

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社...
【开源推广】烧了几百亿 token,写了个运行在浏览器里的安卓系统
开源推广】烧了几百亿 token,写了个运行在浏览器里的安卓系统
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
  • 我的帖子已经打上 开源推广 标签:
  • 我的开源项目完整开源,无未开源部分:
  • 我的开源项目已链接认可 LINUX DO 社区:
  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
  • 以上选择我承诺是永久有效的,接受社区和佬友监督:

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出


MobileGym (不是移动健身房)

有点标题党了,但是真烧了几百亿 Token,纯前端 TypeScript + React,实现了28 个仿真 APP——微信、支付宝、小红书、bilibili、X、Reddit、微信读书、12306、腾讯会议、Spotify、eBay, 外加桌面、设置、通讯录、短信、相册、日历、文件、浏览器等系统应用。 桌面兼容小米主题包、支持自定义小组件,Activity 栈、Intent、手势返回、键盘适配这些 Android 系统机制全部在浏览器里重写了一遍。

虽然本来是为了研究 GUI Agent 打造的,但是佬友们也完全欢迎来玩啊——可以顺便研究一下安卓系统的一些机制(?我自己也不太懂),或者直接 fork 代码去搞点别的(法律允许范围内 :saluting_face:)。在线试玩 :backhand_index_pointing_right: mobilegym.dev

image
image
image
image

特性

  • 超轻量,高并发,单实例仅占400M 内存(对比安卓模拟器4-10G),单台服务器支持成百上千个环境实例并行
  • 416 个任务模板,参数化可以生成无限个任务实例,确定性评测,毫秒级出结果,摆脱LLM as a Judge 的不可靠
  • Sim-to-Real 实测有效,在仿真环境用 GRPO 强化学习训练的模型,实测 95% 以上的收益迁移到真机
  • 扩展友好,文档齐全,新增一个 App 只需要建一个文件夹 + 一份 manifest;新写一个任务只需要一个 Python 类,最短三行代码搞定
  • 纯沙盒,无后果,不连真服务、不转真钱、不发真消息,放心瞎点

链接

github.com

GitHub - Purewhiter/mobilegym: MobileGym: A Verifiable and Highly Parallel...

MobileGym: A Verifiable and Highly Parallel Simulation Environment for Mobile GUI Agent Research

35 个帖子 - 22 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文