叠甲:纯主观,基于个人体验。主要比较对象为cc opus4.6/4.7 与 omo 国模
因为5.3-codex就是个流口水的智商,很长一段时间都不想再碰gpt
但是最近羊毛渐少,a畜的号想要活着的期望成本过高,z畜一直看到佬友说429什么的,opencode go感觉最近智商不行,基于这个智商,10刀还是太贵了……
5.5应该长进了很多,那就决定勇闯土区gpt了
昨天晚上找到了我的老水果机,登上土区号,斥80块巨资买了500TRL礼品卡开了plus
5.5 没敢开xhigh,事实上只开high也马上蹬完5小时限制了,只能睡觉
自己开的官方,感觉是比第三方api来得稍微阳间一点点
但是5.5个人体感远谈不上惊艳,比“能用”稍好一点
首先,文字处理/一般对话/写作 上,gpt的逻辑性很弱,而且在长文本上容易自己偷偷加料。在这一点上,被opus4.x和glm5.1吊打
其次,我怀疑gpt的中文能力比较弱,指令理解与遵循比较差劲。在网页端中文对话thinking的时候,就看到有闪过什么“用户……中文……”之类的东西,因此怀疑gpt不能直接地/准确地理解中文。
以下是我codex中的对话片段:
是,我应该先和你确认,而不是直接保留 events/YYYY-Www.jsonl。当时我的判断是:你说“考虑 weekly jsonl 就用固定的 weekly.jsonl”,我把它理解成一个方向,而不是最终决策
我说考虑做什么,它既不考虑(没有与我确认或讨论),也不做,“只是理解成一个方向”,wtf??? 我以后还是尽量用英文和codex对话吧
在codex用5.5时,感觉它往往没有充分理解我的需求,就急吼吼去做了,然后自己跑测试,出十几二十个error,又去联网查资料、修bug……好在最后都能修好。
大家在用codex的时候有cc/omo那种让你确认几个选项然后confirm的机制吗?如果没有,那codex-cli确实做得垃圾,我用额外的prompt也应该无法弥补那样的体验。难道说不管需求简不简单,必须要先/plan ?
1 个帖子 - 1 位参与者