最近一直在研究如何让codex达到opus的效果

用规范指令把 Codex/Gemini 调教成 Opus 的味道——附中转站测试名额 Opus 是真的好用,但贵得离谱,到处开会员扛不住。 写代码一直用 IDE,qcode、Trae、Cursor、VS Code、Antigravity都用过,现在主要在 VS Code 和 Trae 之间来回,这俩...
最近一直在研究如何让codex达到opus的效果
最近一直在研究如何让codex达到opus的效果

用规范指令把 Codex/Gemini 调教成 Opus 的味道——附中转站测试名额

Opus 是真的好用,但贵得离谱,到处开会员扛不住。

写代码一直用 IDE,qcode、Trae、Cursor、VS Code、Antigravity都用过,现在主要在 VS Code 和 Trae 之间来回,这俩都能接自定义 API 中转。于是就开始折腾:怎么在 IDE 里尽量把 Codex 用出 Opus 的感觉。


Codex 让我头疼的几个点

Codex 本身能力不差,但用着就是差口气,主要是这几个问题:

1. 永远在发散,停不下来

“如果你要……下一步可以……”——这个是我最受不了的。几个数据库字段能搞定的事,它能给你扯出几十个方向。任务做完不收手,反复追加建议,越做越大。

2. 分析输出结构乱

Opus 那种从分析到结论、表格、流程整理得清清楚楚的感觉,Codex 基本没有。大段文字糊过来,自己找重点。

3. 指令理解偏差

同样一句话,Opus 能理解到位,Codex 经常差那么一截。理解不到位,后面的最小交付原则也就形同虚设,前两个问题自然就来了。

看过以前帖子的应该知道,我之前分析过 Codex 的规范指令,目标就是想让 Codex、Gemini 尽量向 Opus 的思考方式靠拢。


现在的做法

自己搭了中转站,配合项目规范文件能解决一部分问题。最近换了个新方向:在 API 中转前自己加了一层类似 LiteLLM 的处理逻辑,同时把规范指令文件重新精简了一遍。

自测下来,指令遵循程度大概能到 60%~70% Opus效果左右,用着挺顺手,但因人而异,不同的使用场景效果会有差别。

3ddb97e8-1b50-4750-bf5e-ee7086a064a0
bde9b994-7ef4-4ea5-8f35-bbbeec376d30


邀请测试,免费提供中转站名额

现在想找人一起测试和提意见,免费提供个人自用中转站月订阅 10 个名额

  • 每日限额:$50
  • 每周限额:$300
  • 每月限额:$1000

参与要求:

  1. 主要用 IDE 写代码的优先——这样才有对比感,测试才有意义。需要提供使用过程截图。

  2. 能认真反馈问题——规范可以继续加,但不保证都能解决,反馈越具体越有价值。

  3. 严禁在成熟项目或含隐私信息的项目中使用——包括但不限于:生产代码、含密钥的配置、自用 API 等。新建测试项目,这是唯一正确用法。

  4. 不要白嫖——如果你用的不是 IDE,或者额度消耗极少,我会直接取消订阅。

名额 10 个,满足条件先到先得。因为plus账号目前不多,后续会根据情况补充。


后续想做的几件事

方向有了,能不能跑通还不确定,token 消耗也是个问题,说出来看看大家怎么看:

1. 继续优化全局规范指令
基础盘,持续打磨。

2. 项目规范"自进化"
让指令能在项目开发过程中自动更新规范文件。举个例子:项目里有文件 A 和 B 存在关联,改了 A,AI 能自动知道 B 也要跟着改;新增了功能模块,规范文件里对应补上这个模块的说明和用法。

3. 项目级索引(可能有点鸡肋,但我在用)
我 PHP 项目的做法:生成一个 docs 文件夹,里面记录各模块定义、方法注释、输入输出参数。每次更新关键文件后跑脚本同步,让 AI 始终掌握项目全貌再开发。效果还行,就是维护成本在那里。

有别的想法欢迎说,一起讨论。


暂不考虑开源,现在问题还比较多,搭建流程也麻烦——API 接口不是走 sub2api 那种域名直连,其他组件都要自己搭,很多东西实现得也不确定。

参与方式,私信.我会将我的中转站发给你,将账号发给我,给你开通订阅,然后用我发给你的api链接(不要使用中转站api)+key+model名称进行使用

17 个帖子 - 10 位参与者

阅读完整话题

来源: linux.do查看原文