关于gpt5.5个人一点小的测试

编辑部 2026-05-04T12:20:59.972577 45333 阅读 tech

在一个黑色的袋子里放有三种口味的糖果，每种糖果有两种不同的形状（圆形和五角星形，不同的形状靠手感可以分辨）。现已知不同口味的糖和不同形状的数量统计如下表。参赛者需要在活动前决定摸出的糖果数目，那么，最少取出多少个糖果才能保证手中同时拥有不同形状的苹果味和桃子味的糖？（同时手中有圆形苹果味匹配五角星桃...

在一个黑色的袋子里放有三种口味的糖果，每种糖果有两种不同的形状（圆形和五角星形，不同的形状靠手感可以分辨）。现已知不同口味的糖和不同形状的数量统计如下表。参赛者需要在活动前决定摸出的糖果数目，那么，最少取出多少个糖果才能保证手中同时拥有不同形状的苹果味和桃子味的糖？（同时手中有圆形苹果味匹配五角星桃子味糖果，或者有圆形桃子味匹配五角星苹果味糖果都满足要求）

苹果味 桃子味 西瓜味
圆形 7 9 8
五角星形 7 6 4

用来跑上述问题
测试账号 Pro订阅
IP 一致
Codex5.4 xhigh 回复正确答案21
Codex5.5 xhigh 回复29
Codex在加上你必须要深度思考这个问题后回复正确答案21
APP中1分钟不到就可以回答出正确答案21 遥遥领先
APIKEY方式指定5.5大概率是和账号是一样的也就是说可以通过该配置文件来使用5.5具体可以用这个题目进行测试

粗浅结论:
5.5比5.4更像一个人,5.4是以理论来解决问题，而5.5是实践来解决问题。

代码层面:5.5的测试变多了会积极读取上下文(不知道是不是错觉运行两次15分钟任务都积极读取) 减少了专业废话速度感觉上是比5.4有所提升的如果要用5.5写文档那些我觉得 你必须要深度思考这个问题 这几个字是很有必要加上的不然他会迅速的完成任务就算你是xhigh他也是不思考 5.4更像一个完美主义的逻辑大师 5.5更像是一个实践派先做再测

4 个帖子 - 4 位参与者

阅读完整话题

来源: linux.do查看原文

关于 gpt5.5 个人一点测试一个帖子现在

关于gpt5.5个人一点小的测试

clawemail天才程序员陨落

这些 GPT Free 号是废了吗

相关推荐