gpt-5.3-codex优于gpt-5.4

就下面的测试 gpt-5.3-codex耗时2分钟出21和29(为了避免题目中的歧义,它自作主张补充说明了什么情况下是29),gpt-5.4耗时5分钟得出21。A畜家的忠实粉可以测一测这个题。 在一个黑色的袋子里放有三种口味的糖果,每种糖果有两种不同的形状(圆形和五角星形,不同的形状靠手感可以分辨)...
gpt-5.3-codex优于gpt-5.4
gpt-5.3-codex优于gpt-5.4

就下面的测试 gpt-5.3-codex耗时2分钟出21和29(为了避免题目中的歧义,它自作主张补充说明了什么情况下是29),gpt-5.4耗时5分钟得出21。A畜家的忠实粉可以测一测这个题。

在一个黑色的袋子里放有三种口味的糖果,每种糖果有两种不同的形状(圆形和五角星形,不同的形状靠手感可以分辨)。现已知不同口味的糖和不同形状的数量统计如下表。参赛者需要在活动前决定摸出的糖果数目,那么,最少取出多少个糖果才能保证手中同时拥有不同形状的苹果味和桃子味的糖?(同时手中有圆形苹果味匹配五角星桃子味糖果,或者有圆形桃子味匹配五角星苹果味糖果都满足要求)

苹果味 桃子味 西瓜味

圆形 7 9 8

五角星形 7 6 4

11 个帖子 - 8 位参与者

阅读完整话题

来源: linux.do查看原文