【开源自荐】codex开发,claude审查的合作开发skills

介绍由codex生成。 感谢:那个男人!Member你就是我的神 ! trellis项目的大佬 桃酥! 我的搭配使用:开发框架:trellis 开发规范:卡帕西 拷打模糊细节skill:grill-me 使用方法,让claude cli、codex app同时配置Dual AI Collaborat...
【开源自荐】codex开发,claude审查的合作开发skills
开源自荐codex开发,claude审查的合作开发skills

介绍由codex生成。
感谢:那个男人!Member你就是我的神 !
trellis项目的大佬 桃酥!
我的搭配使用:开发框架:trellis 开发规范:卡帕西 拷打模糊细节skill:grill-me
使用方法,让claude cli、codex app同时配置Dual AI Collaboration Skill,在codex挂一堆“继续”,然后睡觉。也有人工审查模式,可自行开启关闭。
希望有佬友给我反馈。

Dual AI Collaboration Skill 说明文档

这是什么

dual-ai-collaboration 是一套让 Codex 负责开发、Claude 负责审查、用户保留最终决策权 的 AI 协作开发协议。

它不是一个具体项目框架,也不是某个语言的代码模板,而是一套跨项目可复用的协作规则:规定什么时候开发、什么时候交接、怎么审查、怎么记录上下文、怎么防止两个 AI 互相附和,以及在用户不在场时如何安全连续推进。

简单说,它解决的是:

  • Codex 连续开发后,Claude 怎么知道最近到底改了什么;
  • Claude 审查时如何不被 Codex 的说法带偏;
  • 两个 AI 都同意时,哪些事仍然必须问用户;
  • 用户睡觉或离开时,开发如何继续但不丢审查边界;
  • 当项目质量慢慢变差时,AI 如何主动报警;
  • 当功能做完但没有新开发价值时,AI 如何切到真实验收,而不是继续乱加功能。

适合谁

适合这些使用方式:

  • 你经常用 Codex 做主要开发;
  • 你希望 Claude 作为独立 Reviewer 审查 Codex 的工作;
  • 你会一次性让 AI 连续开发较长时间;
  • 你担心 AI 之间互相迎合、只会修修补补;
  • 你希望新会话也能从项目文档恢复上下文;
  • 你不是专业开发者,希望 AI 不要把技术选项丢给你,而是给出推荐方案和风险说明。

不太适合:

  • 只做一次性小脚本;
  • 不希望维护任何项目状态文档;
  • 不需要代码审查或长期项目质量管理;
  • 需要完全无人值守执行高风险生产操作。

核心角色

Codex:Primary AI

Codex 负责主要开发和维护项目文件。

它需要:

  • 实现功能;
  • 更新状态、任务索引、交接日志;
  • 在合适节点准备给 Claude 的 handoff;
  • 独立判断 Claude 的建议是否真的应该采纳;
  • 发现项目质量下降时主动提醒;
  • 在连续开发或无人值守模式中切分可审查的工作批次。

Claude:Reviewer AI

Claude 负责审查、挑战和提出改进建议。

它需要:

  • 独立阅读项目文件和 diff;
  • 不把 Codex 的 review_request 当作审查边界;
  • 判断这次开发是否符合最终产品方向;
  • 检查质量下降信号;
  • 对 Codex 的 AI UAT 验收结果进行审查;
  • 对高风险事项提醒用户,而不是替用户批准。

用户:最终决策者

用户不需要决定具体实现细节,但保留最终权力。

必须由用户决定的事情包括:

  • 产品方向变化;
  • 高风险数据操作;
  • 真实 secrets、支付、公开发布;
  • 隐私、权限、真实用户数据;
  • 两个 AI 无法收敛的重大分歧;
  • 是否接受或驳回重要风险。

主要能力

1. 标准交接与审查

Codex 完成一段工作后,会写 HANDOFF

Claude 根据 HANDOFF、项目状态文件、当前 diff 和日志输出 REVIEW

人工流程是:

Codex 写 HANDOFF -> 用户复制给 Claude -> Claude 输出 REVIEW -> 用户贴回 Codex

桥接流程是:

Codex 写 HANDOFF -> Codex 调用本机 Claude CLI -> Claude 输出 REVIEW -> Codex 读取并归档

两者使用同一套文档和模板。

2. 连续开发与批量审查

用户可以让 Codex 不要每个小改动都停下来找 Claude,而是连续推进。

触发审查提醒的典型节点:

  • 完成一个可运行功能切片;
  • 一个页面/API/数据流打通;
  • 触及 8 个以上重要文件;
  • 有约 1000 行有意义改动;
  • 累积 5 个小任务;
  • 准备提交、发布、归档或标记完成。

时间本身不是硬限制。不是“开发 2 小时必须停”,而是看改动体量和风险。

3. 无人值守开发

当用户明确授权后,Codex 可以在用户离开、睡觉时继续低风险开发。

它必须:

  • 记录授权范围;
  • 记录停止条件;
  • 到达审查节点时写入 review_pending
  • 不把未审查内容当作已通过;
  • 不跨越高风险边界;
  • 不用用户预设的“继续”扩大权限。

如果用户预设多个“继续”,Codex 可以继续同一授权窗口内的低风险任务,但不能用它跳过高风险决策。

4. Quality Sentinel 质量哨兵

Sentinel 用来防止项目慢慢变烂。

它关注的不是“每次都找一个问题”,而是累积证据:

  • 类似 bug 反复出现;
  • 同一个 P2/P3 问题多次延期;
  • 单文件过大且没有拆分计划;
  • 测试、lint、type-check 被多次跳过;
  • smoke/test 明显变慢;
  • 低优先级问题在批量开发中积累;
  • reviewer 反复给无证据 approval。

Sentinel 不允许 AI 为了显得严格而编造风险。所有告警必须有证据。

5. AI UAT / 拟人化验收

当“继续开发”已经没有明显价值,但最近功能需要验收时,Codex 应该切到 AI UAT。

AI UAT 要求 Codex 像真实用户一样操作产品:

  • 启动或复用本地 dev server;
  • 用 Browser/Playwright 点击、输入、刷新、提交;
  • 测试 happy path;
  • 测试一个合理的错误路径;
  • 检查 console/runtime 错误;
  • 检查加载、空状态、错误状态、持久化等;
  • 小问题可以自修并复测。

AI UAT 不是用户验收。它只能作为 ai_generated 证据,不能代替用户最终确认。

6. 项目阶段与风险配置

协议区分不同项目阶段:

  • personal_dev:个人本地自用;
  • prototype:早期原型;
  • internal_test:内部测试;
  • public_release:公开发布或生产使用。

个人自用阶段可以放宽一些限制,例如没有登录系统、使用本地 .env.local、临时 API/schema 调整等。

但有些事情永远不能自动放宽:

  • 真实密钥提交到仓库;
  • 不可逆删除真实数据;
  • 真实扣费或生产支付;
  • 公开发布或部署;
  • 处理他人隐私数据;
  • 不明原因的数据损坏或验证失败;
  • P0/P1 风险。

7. 自主 Claude 审查桥接模式

这是默认关闭的高级模式。

启用后,Codex 可以在需要审查时调用本机 Claude CLI,让 Claude 自动审查,并读取结果。

重点规则:

  • 必须由用户显式开启;
  • 桥接只是替代复制粘贴,不改变审查协议;
  • Codex 调用的是用户本机 claude CLI,使用用户自己的 Claude 配置/API/额度;
  • 首次使用必须做 Claude 会话配对检查;
  • 如果一个项目有多个 Claude 会话或多个子工程,推荐用户手动 /resume 到正确会话,再让 Codex 做配对验证;
  • 上下文满、API 失败、权限失败、输出截断、进错会话等异常必须停止并报告用户。

桥接模式不会让两个 AI 自动批准高风险事项。

推荐项目文件

英文/code 项目常用:

STATUS.md
PLAN-CHANGELOG.md
COLLAB-TASK-INDEX.md
COLLAB-HANDOFF.md
COLLAB-CONTEXT.md
REVIEW-LOG.md
QUALITY-SIGNALS.md

中文项目可对应为:

状态-当前闭环.md
计划-演进日志.md
协作-任务索引.md
协作-交接日志.md
协作-Codex上下文日志.md
审核-互审记录.md
QUALITY-SIGNALS.md

这些文件让新会话、新 AI、Claude/Gemini 审查者都能从文档恢复上下文,而不是依赖聊天记忆。

推荐启动提示词

新项目可以这样对 Codex 说:

加载 trellis、karpathy-guidelines、dual-ai-collaboration。

请先初始化项目协作流程:
1. 判断当前项目阶段和风险配置;
2. 如果需求模糊,使用 grill-me 方式一次问我一个关键问题;
3. 建立或更新 STATUS.md、PLAN-CHANGELOG.md、COLLAB-TASK-INDEX.md、COLLAB-HANDOFF.md、COLLAB-CONTEXT.md、REVIEW-LOG.md、QUALITY-SIGNALS.md;
4. 写一份 INIT / HANDOFF,说明当前项目目标、已知状态、下一步计划,方便 Claude 审查;
5. 后续由 Codex 主要开发,Claude 独立审查,用户保留最终决策权。

已有项目可以这样纠偏:

加载 dual-ai-collaboration,并更正当前项目的协作使用方式。

请读取 STATUS.md、PLAN-CHANGELOG.md、COLLAB-TASK-INDEX.md、COLLAB-HANDOFF.md、COLLAB-CONTEXT.md、REVIEW-LOG.md。
如果缺少必要文件,请补齐最小可用版本。

然后:
1. 找到上次 Claude 已审查边界;
2. 汇总之后 Codex 新开发但未审查的内容;
3. 按合理批次准备 Claude 审查 handoff;
4. 不要只交接最新一小段;
5. 如果发现审查债、质量下降或方向风险,请按 Quality Sentinel 记录。

启用桥接模式可以这样说:

开启 dual-ai-collaboration 的自主 Claude 审查桥接模式。

先不要正式审查。请用 user_guided_cli_resume 方式初始化:
1. 启动本项目的 Claude CLI;
2. 等我手动 /resume 到正确 Claude 会话;
3. 记录启动和会话线索;
4. 发起只读 pairing_check;
5. 对比项目路径、子工程、当前任务、最近 handoff/review;
6. 结果匹配后让我回复 1 再绑定。

为什么值得用

普通 AI 开发的问题不是“不会写代码”,而是长期项目里容易出现这些情况:

  • 上下文丢失;
  • 只修眼前问题;
  • 审查范围被开发者引导;
  • 用户睡觉时积累大量未审查代码;
  • AI 互相礼貌认可;
  • 项目方向一点点偏离;
  • 小质量问题长期堆积;
  • 做完功能后没人像真实用户一样走流程。

这套 skill 的价值是把这些隐性风险变成显性流程。

它不会让 AI 变成完美工程师,但会让 Codex、Claude 和用户之间有清楚的边界、记录和复盘路径。

一句话推荐

如果你用 Codex 长时间开发,又希望 Claude 做独立审查,dual-ai-collaboration 可以把“人工复制粘贴式双 AI 协作”升级成一套可记录、可恢复、可审查、可无人值守推进的项目协作协议。
SKILL.txt (75.5 KB)

2 个帖子 - 2 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文