有没有佬觉得五一期间的 GPT5.5 惨不忍睹

虽然不排除中转站掺水,但是用的是比较知名的中转站,以前也一直用着不错的,就是五一这两天诡异得不行(群友说 4.30 就降智了),几乎完全不能理解用户意图,对项目的认知也经常出现幻觉,我个人遇到的问题就包括但不限于 我 prompt 明确指出先提交再修改(懒得自己写 commit message),它...
有没有佬觉得五一期间的 GPT5.5 惨不忍睹
有没有佬觉得五一期间的 GPT5.5 惨不忍睹

虽然不排除中转站掺水,但是用的是比较知名的中转站,以前也一直用着不错的,就是五一这两天诡异得不行(群友说 4.30 就降智了),几乎完全不能理解用户意图,对项目的认知也经常出现幻觉,我个人遇到的问题就包括但不限于

  1. 我 prompt 明确指出先提交再修改(懒得自己写 commit message),它还是先修改了再问我要 add commit 权限
  2. 偷懒,虽然之前也有但是现在尤其强烈,之前是一个计划明明很小的修改都要分好几步(这也可以说是谨慎算优点),现在是偷偷忽略计划,只做一小部分,然后报告完成了,导致我哼哧哼哧 review 了半天才意识到这写的什么犯病玩意
  3. 对项目中相似但不同层次的概念有混淆,这一点主要是体现在说一堆乱七八糟的不严谨的术语,能看懂但是有歧义,开新的对话它自己都会误解它之前自己在 AGENTS.md 里写的内容
  4. 幻觉率感觉非常高,这个没什么实例,就是之前基本两次以内就能跑通测试,现在看它一直跑测试
  5. 最难绷的,自己修改测试然后给出理由,这本身倒没啥,如果实现细节更改了那测试里的某些约束也确实要改,但是它有时候会分析错误还不报告给我说,直接自己就擅自改动然后说跑通测试了,那我也总不能给它权限都收紧了一次一次更改看吧,那按它现在的智商写好几次写不对我岂不是要累死在 codex 上面

我用的是 GPT 5.5 high,是不是应该用 xhigh? 不过 high 的 token 消耗就有点恐怖了,xhigh 的话又要出血了:sob:

五一本来想一天干完全部然后玩四天,结果折腾两天差点负进度,但是现在手里有活没完成心理还堵着玩不爽,能别折磨我了吗

弄得我想去古法编程了,心累

10 个帖子 - 6 位参与者

阅读完整话题

来源: linux.do查看原文