评分 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

评分 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 15 篇相关文章

deepseek v4 pro评分

livebench出deepseek v4 pro的评分了,现阶段开源模型第一名(第二是kimi 2.6),除了coding略差。 7 个帖子 - 6 位参与者 阅读完整话题

tech linux.do 2026-05-04 12:56:13+08:00

发现大模型编程体验上两个很实用的指标

大模型有各种测试、评分,看的眼花缭乱。 对于 Vibing Coding 来说,这两个指标感觉很重要: 召回率:大模型对前面的信息还能记住多少 指令遵循:大模型能不能按要求办事 我找到了这两个网站: 召回率: https://contextarena.ai/ 指令遵循: http

tech linux.do 2026-04-30 10:46:02+08:00

[华为] 有参加鸿蒙开发者激励计划的开发者吗,来互助呀~

参加了开发者激励计划,有互助下载评分的吗 应用名称:随机头像

tech v2ex.com 2026-04-28 21:59:43+08:00

[华为] 有参加鸿蒙开发者激励计划的开发者吗,来互助呀~

参加了开发者激励计划,有互助下载评分的吗 应用名称:随机头像

tech v2ex.com 2026-04-28 20:59:43+08:00

GPT-5.5模型的Arena的评分排行出来了

从官方发文搬过来的,没想到的是代码这块居然会被glm、kimi压下去。详细内容如下: 36 个帖子 - 20 位参与者 阅读完整话题

tech linux.do 2026-04-28 08:32:42+08:00

没人关注deepseekV4只是预览版吗?

官方说这是预览版,那正式版是不是就更强了呀,不是完全体评分都在开源第一梯队了,如果是正式版,会不会有多模态能力捏~~以前看到有佬许愿要大上下文窗口,应验了,我们是不是可以期待一手多模态了,然后等 昇腾950 部署好了,再把多模态上了,来个正式版V4,perfect! 3 个帖子

tech linux.do 2026-04-24 18:40:24+08:00

DeepSeek v4 在 Arena Leaderboard 排名出来了

Text Arena 目前评分貌似不如 Qwen 3.5 Max,不过新模型后续排名变动应该会比较大,不排除会大幅上涨的可能性。 Code Arena 天气卡片实测: DeepSeek v4 pro 天气卡片测试来了,结果有点意外 开发调优 [PixPin2026-04-2411

tech linux.do 2026-04-24 12:44:03+08:00

大模型-神厨的自我修养

为啥每次发布大模型都是各个维度的评分几分几分的涨,感觉是不是大家都是为了细水长流?不会做出较大跨度的更新。 刀法比老黄还精湛 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-24 10:11:33+08:00

在L站买过付费中转站的大佬们,希望多去 rate.linux.do 评价一下。

LinuxDo商家评价平台 在L站买过付费中转站的大佬们,希望多去 rate.linux.do 评分一下。 相关的评价才678条,体验最好能够写长一点。对后面购买的人一个参考。 不是说 差评马上去评价,好评也应该去评价。建议商家搞一下活动,评价 返用户 token兑换码。 感谢大

tech linux.do 2026-04-23 11:20:13+08:00

gpt-image2 的绘图能力评分直接狠超nano banana2 200分

直接一波断代式增长,gpt-4o的底子还在,生图是能让大众最快感受到ai能力的地方,就类似与 openclaw让非专业从业者部分感受到了前沿ai的魅力 10 个帖子 - 8 位参与者 阅读完整话题

tech linux.do 2026-04-22 09:03:50+08:00

ai评标,评分低怎么破局?

现在投标项目都是ai类人评标,从去年八月份开始就再没中过标了,看网上有大量的ai写投标文件,我们主要也是做工程项目,想问下大家,像网上的那种ai来写投标文件中标的几率大吗?好不好用? 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-21 17:01:15+08:00

【开源】天下苦水军久矣!我用大模型干碎了豆瓣和 Steam 的评分系统!!

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺

tech linux.do 2026-04-21 09:10:59+08:00

四星好评反成“差评”,苹果 App Store 评分体系遭开发者质疑

IT之家 4 月 21 日消息,据 9to5mac 报道,开发者们认为,苹果 App Store 的评分体系在至少几个方面存在根本性缺陷,其中就包括:你给出的四星评分,反而可能弊大于利。 他们还指出了一个矛盾点:用户不希望自己的应用使用体验被打断,而苹果实际上却在迫使开发者不断催

tech www.ithome.com 2026-04-21 07:40:56+08:00

卡普空迎来黄金时代:最近五款游戏 M 站评分均超 80 分

IT之家 4 月 20 日消息,卡普空堪称近十年来最成功的游戏工作室之一,该工作室已连续八年实现盈利,预计今年仍将延续这一佳绩,而这一切都归功于其始终坚持推出高品质作品。 卡普空在过去一年半内发售的五款新作,在知名评分网站 Metacritic 上均斩获 80 分及以上的高分。在

tech www.ithome.com 2026-04-20 10:30:26+08:00

[假的xdm] 疑似deepseekV4评分流出?业界领先水平

微信公众号推流的文章点进去看了一下 不知真假 真的话真是香爆了 10 个帖子 - 10 位参与者 阅读完整话题

tech linux.do 2026-04-19 22:15:45+08:00