介绍由codex生成。
感谢:那个男人!Member你就是我的神 !
trellis项目的大佬 桃酥!
我的搭配使用:开发框架:trellis 开发规范:卡帕西 拷打模糊细节skill:grill-me
使用方法,让claude cli、codex app同时配置Dual AI Collaboration Skill,在codex挂一堆“继续”,然后睡觉。也有人工审查模式,可自行开启关闭。
希望有佬友给我反馈。
Dual AI Collaboration Skill 说明文档
这是什么
dual-ai-collaboration 是一套让 Codex 负责开发、Claude 负责审查、用户保留最终决策权 的 AI 协作开发协议。
它不是一个具体项目框架,也不是某个语言的代码模板,而是一套跨项目可复用的协作规则:规定什么时候开发、什么时候交接、怎么审查、怎么记录上下文、怎么防止两个 AI 互相附和,以及在用户不在场时如何安全连续推进。
简单说,它解决的是:
- Codex 连续开发后,Claude 怎么知道最近到底改了什么;
- Claude 审查时如何不被 Codex 的说法带偏;
- 两个 AI 都同意时,哪些事仍然必须问用户;
- 用户睡觉或离开时,开发如何继续但不丢审查边界;
- 当项目质量慢慢变差时,AI 如何主动报警;
- 当功能做完但没有新开发价值时,AI 如何切到真实验收,而不是继续乱加功能。
适合谁
适合这些使用方式:
- 你经常用 Codex 做主要开发;
- 你希望 Claude 作为独立 Reviewer 审查 Codex 的工作;
- 你会一次性让 AI 连续开发较长时间;
- 你担心 AI 之间互相迎合、只会修修补补;
- 你希望新会话也能从项目文档恢复上下文;
- 你不是专业开发者,希望 AI 不要把技术选项丢给你,而是给出推荐方案和风险说明。
不太适合:
- 只做一次性小脚本;
- 不希望维护任何项目状态文档;
- 不需要代码审查或长期项目质量管理;
- 需要完全无人值守执行高风险生产操作。
核心角色
Codex:Primary AI
Codex 负责主要开发和维护项目文件。
它需要:
- 实现功能;
- 更新状态、任务索引、交接日志;
- 在合适节点准备给 Claude 的 handoff;
- 独立判断 Claude 的建议是否真的应该采纳;
- 发现项目质量下降时主动提醒;
- 在连续开发或无人值守模式中切分可审查的工作批次。
Claude:Reviewer AI
Claude 负责审查、挑战和提出改进建议。
它需要:
- 独立阅读项目文件和 diff;
- 不把 Codex 的
review_request当作审查边界; - 判断这次开发是否符合最终产品方向;
- 检查质量下降信号;
- 对 Codex 的 AI UAT 验收结果进行审查;
- 对高风险事项提醒用户,而不是替用户批准。
用户:最终决策者
用户不需要决定具体实现细节,但保留最终权力。
必须由用户决定的事情包括:
- 产品方向变化;
- 高风险数据操作;
- 真实 secrets、支付、公开发布;
- 隐私、权限、真实用户数据;
- 两个 AI 无法收敛的重大分歧;
- 是否接受或驳回重要风险。
主要能力
1. 标准交接与审查
Codex 完成一段工作后,会写 HANDOFF。
Claude 根据 HANDOFF、项目状态文件、当前 diff 和日志输出 REVIEW。
人工流程是:
Codex 写 HANDOFF -> 用户复制给 Claude -> Claude 输出 REVIEW -> 用户贴回 Codex
桥接流程是:
Codex 写 HANDOFF -> Codex 调用本机 Claude CLI -> Claude 输出 REVIEW -> Codex 读取并归档
两者使用同一套文档和模板。
2. 连续开发与批量审查
用户可以让 Codex 不要每个小改动都停下来找 Claude,而是连续推进。
触发审查提醒的典型节点:
- 完成一个可运行功能切片;
- 一个页面/API/数据流打通;
- 触及 8 个以上重要文件;
- 有约 1000 行有意义改动;
- 累积 5 个小任务;
- 准备提交、发布、归档或标记完成。
时间本身不是硬限制。不是“开发 2 小时必须停”,而是看改动体量和风险。
3. 无人值守开发
当用户明确授权后,Codex 可以在用户离开、睡觉时继续低风险开发。
它必须:
- 记录授权范围;
- 记录停止条件;
- 到达审查节点时写入
review_pending; - 不把未审查内容当作已通过;
- 不跨越高风险边界;
- 不用用户预设的“继续”扩大权限。
如果用户预设多个“继续”,Codex 可以继续同一授权窗口内的低风险任务,但不能用它跳过高风险决策。
4. Quality Sentinel 质量哨兵
Sentinel 用来防止项目慢慢变烂。
它关注的不是“每次都找一个问题”,而是累积证据:
- 类似 bug 反复出现;
- 同一个 P2/P3 问题多次延期;
- 单文件过大且没有拆分计划;
- 测试、lint、type-check 被多次跳过;
- smoke/test 明显变慢;
- 低优先级问题在批量开发中积累;
- reviewer 反复给无证据 approval。
Sentinel 不允许 AI 为了显得严格而编造风险。所有告警必须有证据。
5. AI UAT / 拟人化验收
当“继续开发”已经没有明显价值,但最近功能需要验收时,Codex 应该切到 AI UAT。
AI UAT 要求 Codex 像真实用户一样操作产品:
- 启动或复用本地 dev server;
- 用 Browser/Playwright 点击、输入、刷新、提交;
- 测试 happy path;
- 测试一个合理的错误路径;
- 检查 console/runtime 错误;
- 检查加载、空状态、错误状态、持久化等;
- 小问题可以自修并复测。
AI UAT 不是用户验收。它只能作为 ai_generated 证据,不能代替用户最终确认。
6. 项目阶段与风险配置
协议区分不同项目阶段:
personal_dev:个人本地自用;prototype:早期原型;internal_test:内部测试;public_release:公开发布或生产使用。
个人自用阶段可以放宽一些限制,例如没有登录系统、使用本地 .env.local、临时 API/schema 调整等。
但有些事情永远不能自动放宽:
- 真实密钥提交到仓库;
- 不可逆删除真实数据;
- 真实扣费或生产支付;
- 公开发布或部署;
- 处理他人隐私数据;
- 不明原因的数据损坏或验证失败;
- P0/P1 风险。
7. 自主 Claude 审查桥接模式
这是默认关闭的高级模式。
启用后,Codex 可以在需要审查时调用本机 Claude CLI,让 Claude 自动审查,并读取结果。
重点规则:
- 必须由用户显式开启;
- 桥接只是替代复制粘贴,不改变审查协议;
- Codex 调用的是用户本机
claudeCLI,使用用户自己的 Claude 配置/API/额度; - 首次使用必须做 Claude 会话配对检查;
- 如果一个项目有多个 Claude 会话或多个子工程,推荐用户手动
/resume到正确会话,再让 Codex 做配对验证; - 上下文满、API 失败、权限失败、输出截断、进错会话等异常必须停止并报告用户。
桥接模式不会让两个 AI 自动批准高风险事项。
推荐项目文件
英文/code 项目常用:
STATUS.md
PLAN-CHANGELOG.md
COLLAB-TASK-INDEX.md
COLLAB-HANDOFF.md
COLLAB-CONTEXT.md
REVIEW-LOG.md
QUALITY-SIGNALS.md
中文项目可对应为:
状态-当前闭环.md
计划-演进日志.md
协作-任务索引.md
协作-交接日志.md
协作-Codex上下文日志.md
审核-互审记录.md
QUALITY-SIGNALS.md
这些文件让新会话、新 AI、Claude/Gemini 审查者都能从文档恢复上下文,而不是依赖聊天记忆。
推荐启动提示词
新项目可以这样对 Codex 说:
加载 trellis、karpathy-guidelines、dual-ai-collaboration。
请先初始化项目协作流程:
1. 判断当前项目阶段和风险配置;
2. 如果需求模糊,使用 grill-me 方式一次问我一个关键问题;
3. 建立或更新 STATUS.md、PLAN-CHANGELOG.md、COLLAB-TASK-INDEX.md、COLLAB-HANDOFF.md、COLLAB-CONTEXT.md、REVIEW-LOG.md、QUALITY-SIGNALS.md;
4. 写一份 INIT / HANDOFF,说明当前项目目标、已知状态、下一步计划,方便 Claude 审查;
5. 后续由 Codex 主要开发,Claude 独立审查,用户保留最终决策权。
已有项目可以这样纠偏:
加载 dual-ai-collaboration,并更正当前项目的协作使用方式。
请读取 STATUS.md、PLAN-CHANGELOG.md、COLLAB-TASK-INDEX.md、COLLAB-HANDOFF.md、COLLAB-CONTEXT.md、REVIEW-LOG.md。
如果缺少必要文件,请补齐最小可用版本。
然后:
1. 找到上次 Claude 已审查边界;
2. 汇总之后 Codex 新开发但未审查的内容;
3. 按合理批次准备 Claude 审查 handoff;
4. 不要只交接最新一小段;
5. 如果发现审查债、质量下降或方向风险,请按 Quality Sentinel 记录。
启用桥接模式可以这样说:
开启 dual-ai-collaboration 的自主 Claude 审查桥接模式。
先不要正式审查。请用 user_guided_cli_resume 方式初始化:
1. 启动本项目的 Claude CLI;
2. 等我手动 /resume 到正确 Claude 会话;
3. 记录启动和会话线索;
4. 发起只读 pairing_check;
5. 对比项目路径、子工程、当前任务、最近 handoff/review;
6. 结果匹配后让我回复 1 再绑定。
为什么值得用
普通 AI 开发的问题不是“不会写代码”,而是长期项目里容易出现这些情况:
- 上下文丢失;
- 只修眼前问题;
- 审查范围被开发者引导;
- 用户睡觉时积累大量未审查代码;
- AI 互相礼貌认可;
- 项目方向一点点偏离;
- 小质量问题长期堆积;
- 做完功能后没人像真实用户一样走流程。
这套 skill 的价值是把这些隐性风险变成显性流程。
它不会让 AI 变成完美工程师,但会让 Codex、Claude 和用户之间有清楚的边界、记录和复盘路径。
一句话推荐
如果你用 Codex 长时间开发,又希望 Claude 做独立审查,dual-ai-collaboration 可以把“人工复制粘贴式双 AI 协作”升级成一套可记录、可恢复、可审查、可无人值守推进的项目协作协议。
SKILL.txt (75.5 KB)
2 个帖子 - 2 位参与者