Ultra-Goal: 解放注意力,一句话让 Agent 跑完超长程任务的 Skill

仓库: https://github.com/Azure99/ultra-goal superpowers/gsd 这类由 sdd 驱动的工具做严肃需求很好用。但是,如果要做一些超长程/需要调研再实施的任务,还是有一些痛点的: 决策阶段的注意力依旧没办法解放,因为你要定一个又一个的偏好,即使它本身有...
Ultra-Goal: 解放注意力,一句话让 Agent 跑完超长程任务的 Skill
Ultra-Goal: 解放注意力,一句话让 Agent 跑完超长程任务的 Skill

仓库:https://github.com/Azure99/ultra-goal

superpowers/gsd 这类由 sdd 驱动的工具做严肃需求很好用。但是,如果要做一些超长程/需要调研再实施的任务,还是有一些痛点的:

  • 决策阶段的注意力依旧没办法解放,因为你要定一个又一个的偏好,即使它本身有最佳实践。如果你的脑子里没有太多想法,只是想搓个原型看看什么样,agent 给你罗列的方案只会造成信息过载。
  • 在真正实施之前往往很难想清所有细节,特别是长任务,如果 spec/plan 实施到一半,才发现设计有缺陷,非常容易越做越偏,甚至需要推倒重来。大规模一些的重构,或者是需要调研再实施的任务,非常容易出现这种情况。

从 ultra goal 的名字就能看出,它是以目标驱动的,只需要给定一个清晰的目标,但不需要具体实现细节,agent 会在执行时动态调整。(核心提示词只有 1000 tokens 出头,比 readme 都少)

接收到用户目标后,会先在工作环境中探索,然后动态拆解出按阶段划分的 roadmap 。

每执行一个阶段,都有规划、实施、验收、提交四个步骤。主 agent 只做协调,避免频繁的上下文压缩,子 agent 推进工作,并把工作文档落盘。

  • 规划:协调两个子 agent ,先独立的设计实施方案,再由主 agent 交叉复审定 plan(这是最核心的,如果只让一个 agent 来定方案,非常容易有疏漏,superpowers 这类工具会不断的让你定决策。然而,如果让两个子 agent 各出一版再交给主 agent 仲裁,大部分决策其实完全不需要人参与)
  • 实施:没什么特别的,就是一个子 agent 照着 plan 去改代码、自测。
  • 验收:同样会开多个子 agent ,分不同视角 review ,然后交叉看各自的报告,主 agent 定级、去重,如果有必修问题就会打回重改。

每做完一个阶段,主 agent 都会根据当前状态,看看是否要修改 roadmap ,比如发现某个方案实际是不可实施的,就可以调整,一切以达成目标为主。


当然,它的缺点一样很大,执行时间长,会巨烧 token ,如果你的目标定的大,一次跑两天都是有可能的(烧掉你十几亿 tokens )。最好在 codex 中使用 gpt 5.5 xhigh 当主 agent ,不差钱子 agent 就继续用 5.5 ,差钱子 agent 就用 5.4mini xhigh 。但主 agent 不能差,实测下来超长程的任务,claude 系还是稍微差点意思,国产模型差距会更大。

最适合的场景就是搓原型/调研+实现,以及做可行性验证。--yolo 跑上就可以去睡觉了,小修小补没必要用,严肃线上需求还是要谨慎放手(当然也可以先做一版、确保跑通 人再仔细 review )。

直接安装

npx skills add Azure99/ultra-goal

SKILL 需要手动触发(为了防止模型自己抽风调用)。描述目标时,不需要描述具体的实现细节,但要仅你最大所能提供端到端的验收方式,比如做 Web 应用,就给它 playwright-cli ,让它跑交互/视觉验收,而不是只跑单测。

来源: V2EX - 技术查看原文