Claude Mythos/Fable 5 糖果问题测试

测试模型: Claude Mythos/Fable 5 模型思考强度: xhigh 测试平台:claude官网 结果如下: 一遍正确 。 通过看思考链发现能够直接推理出21这个正确答案,而不是通过纠正得到,这点比 opus 4.7/4.8要强不少。 7 个帖子 - 4 位参与者 阅读完整话题...
Claude Mythos/Fable 5 糖果问题测试
Claude Mythos/Fable 5 糖果问题测试

测试模型:Claude Mythos/Fable 5
模型思考强度:xhigh

image

测试平台:claude官网

结果如下:
一遍正确:white_check_mark:
通过看思考链发现能够直接推理出21这个正确答案,而不是通过纠正得到,这点比 opus 4.7/4.8要强不少。

image
image

7 个帖子 - 4 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文