榜单已经更新了,百度还是我们熟悉的百度,这个帖子冲水了
还没看到哪里能用,但官方帖子中的这8个benchmark看着有点野
好消息是敢于和opus 4.6比较(而不是4.7)
那没事了 榜单已经更新
ERNIE Blog – 9 May 26
文心 5.1 正式发布!多榜登顶,模型"写得好更懂你"
文心 5.1 正式上线,仅使用业界同规模模型约 6% 的预训练成本实现同级别效果领先。通过分离式全异步强化学习与规模化智能体后训练,在 Agent、推理、创作等多维度能力全面升级,Arena 搜索榜国内第一。
10 个帖子 - 9 位参与者