GPT 5.5测评：高效的推理和搞笑的能力

编辑部 2026-05-04T11:07:36.257652 14117 阅读 tech

先放私有bench GPT 5.5涨价了一倍，根据官方说法推理效率更高了。确实如此，5.4时期需要700甚至1000+秒思考的题目，现在400秒就写完了。但代价就是质量并不如5.4思考1000秒写出来的或多或少都存在一些缺陷，整体质量不如5.4。据传参数量也变大了，是oai目前第二大参数量的模型...

先放私有bench

GPT 5.5涨价了一倍，根据官方说法推理效率更高了。确实如此，5.4时期需要700甚至1000+秒思考的题目，现在400秒就写完了。但代价就是质量并不如5.4思考1000秒写出来的

或多或少都存在一些缺陷，整体质量不如5.4。

据传参数量也变大了，是oai目前第二大参数量的模型，可能在知识库和其他方面有所提升，但是预期代码感觉会比5.4更蠢，而且不说人话的毛病虽然改了些，但似乎还是一股味。

总体来说，对不起这个价格

——————————
四月份似乎所有厂商都拉了啊

Claude Opus 4.7测评：拉完了，达里奥也有自己的G 3 Pro 开发调优

先放私有bench [image] 到4.17号早上，佬们的各种骂声已经淹没L站了，就不多描述他的其他拉了放一些结果 [image] 单说这个宝塔我说不如很多国模 [image] 渲染问题在往届没有过 [image] 审美也是区区的而且这一代的思考时间极其长，堪比GPT，给我断流好几次甚至知识库都更弱了 [image] 你如果说这是sonnet，…

kimi2.6测出来也是小范围蠕动。OAI也要坚守image 2的护城河了么
那么谷歌在哪里发财啊

11 个帖子 - 9 位参与者

阅读完整话题

来源: linux.do查看原文

GPT 测评高效推理搞笑一个现在帖子

GPT 5.5测评：高效的推理和搞笑的能力

[ETF] 趁大 A 放假，恒科大涨 3%

求助毕业文章降低ai方法

相关推荐