


用了一上午发现各种问题 除了昨天发的输入框有问题,还有不限于思考loop超出最大输出 死活不回复中文 rust项目连语法都不检查就提交 以及各种幻觉造成的低级错误(如图,括号不匹配都来了,而且连着两三次)
还有思考了六分钟然后超出输出限制了 按他的输出速度明显是循环了或者类似的问题
对比一下codex里的5.5跑的和3.5flash跑的

而且web/app里的3.5flash在不开扩展思考的情况下推理明显不如3.1pro,色盲题是答不对的,到时候整理一下再发
本来想着flash这么快要不升级到ultra100$等codex烧完了替代呢 现在好了看来还不如glm和ds的
真就说美国豆包都算夸了 trae+seed2.0pro都没这么抽象吧
4 个帖子 - 4 位参与者