Arena - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第2页 - 钛刻科技 | TCTI.cn

Arena - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第2页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 37 篇相关文章 · 第 2 / 2 页

[程序员] glm-5.1, kimi-k2.6 在 code arena React 项目上排名 5 和 6,是不是真的好用?

真的假的?

tech v2ex.com 2026-05-02 09:54:59+08:00

[程序员] glm-5.1, kimi-k2.6 在 code arena React 项目上排名 5 和 6,是不是真的好用?

真的假的?

tech v2ex.com 2026-05-02 07:38:05+08:00

[程序员] glm-5.1, kimi-k2.6 在 code arena React 项目上排名 5 和 6,是不是真的好用?

真的假的?

tech v2ex.com 2026-05-02 07:38:05+08:00

GPT-5.5模型的Arena的评分排行出来了

从官方发文搬过来的,没想到的是代码这块居然会被glm、kimi压下去。详细内容如下: 36 个帖子 - 20 位参与者 阅读完整话题

tech linux.do 2026-04-28 08:32:42+08:00

Deepseek V4 雷声大雨点小?Arena排行榜表现极度不佳

看了Lmarena天塌了,比GLM5.1和Kimi 2.6甚至Qwen 3.6 Plus都差(图片由ChatGPT Image 2生成) 6 个帖子 - 6 位参与者 阅读完整话题

tech linux.do 2026-04-24 16:22:34+08:00

DeepSeek v4 在 Arena Leaderboard 排名出来了

Text Arena 目前评分貌似不如 Qwen 3.5 Max,不过新模型后续排名变动应该会比较大,不排除会大幅上涨的可能性。 Code Arena 天气卡片实测: DeepSeek v4 pro 天气卡片测试来了,结果有点意外 开发调优 [PixPin2026-04-2411

tech linux.do 2026-04-24 12:44:03+08:00

Kimi k2.6 在arena.ai coding排名第六,于glm-5.1水平相当

真没必要抢glm-5.1了 5 个帖子 - 5 位参与者 阅读完整话题

tech linux.do 2026-04-23 13:50:51+08:00

使用gpt-image-2生成的终末地角色庄方宜联动中国名茶的海报

Arena AI: The Official AI Ranking & LLM Leaderboard 使用竞技场选择gpt-image-2模型生成 2 个帖子 - 2 位参与者 阅读完整话题

tech linux.do 2026-04-22 21:10:52+08:00

Arena.ai又名“竞技场”,上线了gpt image 2直选,无限制次数使用新选择!附与大香蕉对比图

Side by Side,Direct可直选: Arena | Benchmark & Compare the Best AI Models Arena | Benchmark & Compare the Best AI Models Chat with mult

tech linux.do 2026-04-22 19:09:28+08:00

Gpt image 2太强了!

这是我在Arena4月15日生成的,那时候随便跑都能出,4月16日到至今越来越难跑了,现在还没有灰度我特别想玩 极具真实,我感觉某些cos可以退圈了,我们距离Agi还远吗?赛博朋克的世界逐渐变为现实! 36 个帖子 - 15 位参与者 阅读完整话题

tech linux.do 2026-04-19 16:02:31+08:00

凌晨在tokenarena乱杀,然后被反超

凌晨以来一直霸榜日榜榜一,刚截图的时候被反超了 网站是别的佬友做的,不得不说,好玩: 比比谁更会烧 Token!TokenArena:一个完全开源的 token 统计看板/竞技场(交互/UI 超精美) 开发调优 本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

tech linux.do 2026-04-19 00:25:07+08:00

Claude Opus 4.7上架,但是 LM ArenaText分数与4.6相差不大

4 个帖子 - 3 位参与者 阅读完整话题

tech linux.do 2026-04-18 17:36:39+08:00

Arena 说Opus 4.7确实在一些领域严重倒退

19 个帖子 - 14 位参与者 阅读完整话题

tech linux.do 2026-04-18 15:41:14+08:00

具身智能比赛 ManipArena 求组队 / 求建议

大家好,最近在折腾一个具身智能比赛 ManipArena,想来求点建议,也看看有没有佬友愿意一起研究。 我现在研一,对具身智能挺感兴趣,但相关背景还比较弱,很多东西都在边做边补。暑假想找一段具身方向的实习,所以也有点焦虑简历上项目不够,想趁这段时间认真做一个能拿得出手的东西。 目

tech linux.do 2026-04-18 15:29:32+08:00

三星 Galaxy Z TriFold 三折叠手机在美国停售,生命周期短暂

IT之家 4 月 18 日消息,据科技媒体 GSMArena 今天报道, 三星 Galaxy Z TriFold 的生命周期非常短暂,这款三折叠手机最初只在韩国限量发售,一段时间后便在当地停售。 不过该机在美国市场还是多卖了一段时间, 官方于 4 月 10 日最后一次补货 ,很快

tech www.ithome.com 2026-04-18 15:21:05+08:00

在arena刷的图

如图,是duct-tape1/2/3代号,据说是image2,我这里姑且先当做,如有错误的话还请包涵 刷到一些,然后和同代的GPT对比了一下 一次出图,没有刷第二遍 下面是提示词/图片部分,垫图来源于群友项目的看板娘织羽,以及另一个 本人不懂构图和摄影,乱用词汇的话请无视掉罢(难

tech linux.do 2026-04-18 01:03:45+08:00

阿里巴巴世界模型ABot-PhysWorld登顶WorldArena评测榜首

36氪获悉,近日,阿里巴巴世界模型ABot-PhysWorld登顶WorldArena评测榜首。该模型在物理规律理解与长程动态预测方面表现突出,能够准确预测物体在滑动、堆叠、流体变化等复杂交互中的运动轨迹,并保持多步因果逻辑一致性。区别于仅生成短时视频的模型,ABot-PhysW

tech 36kr.com