opus4.8智商小测,结果很满意,但是先别网页测有 bug

先别拿网页版测,现在有 bug 适应性思考和 effort 设置了没用,还是秒回复不思考,那肯定答不对 脑筋急转弯 (老步骤,新模型先来测这个,也不能说没意义,不只是coding,日常工作场景都会用 红绿色盲 洗车 糖果问题 妈妈的睡觉问题 比 opus4.6 表现还要好一点,opus4.7 就别说...
opus4.8智商小测,结果很满意,但是先别网页测有 bug
opus4.8智商小测结果很满意,但是先别网页测有 bug

先别拿网页版测,现在有 bug
适应性思考和 effort 设置了没用,还是秒回复不思考,那肯定答不对

image


脑筋急转弯

(老步骤,新模型先来测这个,也不能说没意义,不只是coding,日常工作场景都会用

  • 红绿色盲:white_check_mark:
    image
  • 洗车:white_check_mark:
    image
  • 糖果问题:white_check_mark:
    image
  • 妈妈的睡觉问题:white_check_mark:
    image

比 opus4.6 表现还要好一点,opus4.7 就别说了当时测完真的一坨

但是升级 claude code cli 到 v2.1.154,怎么感觉这么卡呢?
回复也很慢,不过我感觉问题不大,只要对了,慢就是快 :joy:

代码能力

测试中,有结果这里同步

ultracode

这是什么?动画倒是花里胡哨的 :joy:测试下

image


终于可以不用万年 4.6 了

image

10 个帖子 - 7 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文