【any的opus4.8测试】红绿色盲仍不对，🔴糖果测试

编辑部 2026-06-02T09:01:03.797776 8893 阅读 tech

继【any】Any上架了opus-4-8【已成功调用】后，使用了any的claude-opus-4-8 测试了一下几个经典问题。测试模型： claude-opus-4.8[1m] effort: max 题目1：红绿色盲问题（点击了解更多详细信息）错误题目2：糖果问题（点击了解更多详细...

继【any】Any上架了opus-4-8【已成功调用】后，使用了any的claude-opus-4-8 测试了一下几个经典问题。

测试模型：claude-opus-4.8[1m]

effort: max

错误

错误

更新的opus 4.8 其实有个 effort: ultra code 模式，于是我试了一下这个模式下对于糖果的测试

输入同样的糖果测试问题，这个effort下自动启用了下面的工作流（有种大炮打蚊子的感觉）

● 工作流已在后台启动（9 个代理：5 个独立求解 + 4 个对抗验证）。等待结果。

大炮打蚊子，没打到，依旧29

欢迎各位佬补充更多问题的测试结果~~

上面问题的答案（来自gpt5.5 cherry studio）（点击了解更多详细信息）

11 个帖子 - 7 位参与者

来源: LinuxDo 最新话题查看原文

any opus4.8 测试红绿色盲糖果一个帖子现在

相关推荐