用 Codex 做复杂开发时,我现在更喜欢把任务拆成三段:实现、验证、审查。
不要一上来就说“帮我做完整功能并优化好”。这类任务太大,模型容易同时改架构、写 UI、改测试,最后不好收口。
我常用的三段式
1. 实现
先实现最小可用版本,不做无关重构。保持现有接口兼容。完成后列出改动文件。
这一段只追求功能跑起来。
2. 验证
运行项目已有 lint/test/typecheck。失败时只修和本次改动相关的问题。
这一段让 Codex 面对真实命令输出,而不是靠猜。
3. 审查
Review the diff for correctness bugs, regression risk, and missing tests. Prioritize runtime behavior over style.
这一段专门抓 bug,不继续扩写功能。
为什么这样有效
因为每一轮只有一个目标:
- 实现轮:把功能做出来
- 验证轮:让命令通过
- 审查轮:找风险
目标越单一,Codex 越不容易发散。
可以写进 AGENTS.md 的部分
## Verification
For code changes, run:
- pnpm lint
- pnpm test
- pnpm typecheck
Fix only failures related to the current task.
可以做成 Skill 的部分
审查阶段最适合做成 Skill,因为 review 标准应该稳定。
比如:
bug-focused-review
frontend-visual-check
security-check
我的感觉是,Codex 不是不能做大任务,而是大任务最好拆成几个清楚的小闭环。
1 个帖子 - 1 位参与者