评估 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

评估 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 81 篇相关文章 · 第 1 / 5 页

话说为什么一些测大模型前端能力的 是测3js呀

为了防止跑题: 本帖说的不是要不要测3js,而是说用3js去评估前端能力是否合理。本帖也不是否定3D前端价值,而是对评测指标的代表性有疑惑。 看到微博,b站一些up测所谓的模型前端能力,结果测试的是3js/Phaser之类的,感觉有点怪怪的,他们的评测呈现的前端能力与主流业务场景

tech LinuxDo 最新话题 2026-05-23 16:41:17+08:00

使用mimo v2.0 v2.5 的感受 mimo-v2.0体验更好??

MIMO模型版本对比分析 评估维度 MIMO v2.5 MIMO v2.0 代码逻辑分析 存在逻辑遗漏,分析不够完整 分析全面,逻辑覆盖较好 需求分析能力 逻辑混乱,结构不清晰 逻辑清晰,易于理解与扩展 工具调用表现 表现一般,存在多余操作 调用流畅,无多余操作 需求扩展性 扩展

tech LinuxDo 最新话题 2026-05-22 20:52:27+08:00

求佬友指导一下就业方向

目前研一,bg是双非本2硕,之前0实习经历,目前研究方向是图像质量评估以及生成模型优化。最近想找个实习(第一篇论文快到收尾阶段了,但是老板要求做两篇,因此可能要偷偷实习,边实习边做第二篇工作),想着找个多模态的跟研究方向契合的,但是同门说多模态属于是算法的,门槛非常高,他觉得ag

tech LinuxDo 最新话题 2026-05-20 21:57:57+08:00

感觉达里奥被奥特曼卷起来了,评估ClaudePro月限1500刀

具体计算过程如下 感觉最近ClaudePro额度加的有点多 理论上5h长期x2、7d限时x1.5 以前5h综合等效4-6USD(考虑缓存) 现在5h综合等效约30-40USD(考虑缓存) 一方面Claude引入了创建缓存折扣至3.125usd,另外一方面以前和现在读取缓存都是免费

tech LinuxDo 最新话题 2026-05-20 00:17:09+08:00

[问与答] 大厂辞职后进入创业公司 B, B 公司业务惨淡,技术方向找工作基本找不到了,简历评估都是 Fail,人生好艰难,大家有什么建议嘛。

大厂辞职后进入创业公司 B ,B 公司业务惨淡,技术方向找工作基本找不到了,简历评估都是 Fail ,人生好艰难,大家有什么建议嘛。

tech v2ex 2026-05-19 19:09:06+08:00

[问与答] 大厂辞职后进入创业公司 B, B 公司业务惨淡,技术方向找工作基本找不到了,简历评估都是 Fail,人生好艰难,大家有什么建议嘛。

大厂辞职后进入创业公司 B ,B 公司业务惨淡,技术方向找工作基本找不到了,简历评估都是 Fail ,人生好艰难,大家有什么建议嘛。

tech v2ex 2026-05-19 19:03:17+08:00

[问与答] 大厂辞职后进入创业公司 B, B 公司业务惨淡,技术方向找工作基本找不到了,简历评估都是 Fail,人生好艰难,大家有什么建议嘛。

大厂辞职后进入创业公司 B ,B 公司业务惨淡,技术方向找工作基本找不到了,简历评估都是 Fail ,人生好艰难,大家有什么建议嘛。

tech v2ex 2026-05-19 18:25:46+08:00

全国首个遥感卫星数据出境安全评估在海南完成,实现“零的突破”

IT之家 5 月 18 日消息,据央视新闻今日报道,记者从海南省委网信办获悉,近日,全国首个遥感卫星数据出境安全评估在海南完成, 实现了遥感卫星数据出境“零的突破” 。 报道称,遥感卫星数据既是数字经济发展的重要数据要素,也是关系国家安全的战略性资源。长期以来,受政策多头交叉、敏

tech IT之家 2026-05-18 22:53:04+08:00

消息称某厂骁龙 8E5 中端新机评估 240Hz 高刷、全新风扇散热,预计为一加 Ace7

IT之家 5 月 18 日消息,博主 @数码闲聊站 今日曝光某厂子系中端新机部分规格,评论区网友推测为一加 Ace7。 据介绍,该机搭载骁龙 8E5 处理器,工程机是 6.78 英寸 1.5K 超高刷直屏,保底 185Hz,评估 240Hz。此外,该机还支持百瓦满血闪充,电池容量

tech IT之家 2026-05-18 17:38:23+08:00

Ayaneo NEXT 2 掌机预售订单预计 6 月出货,再售计划评估中

IT之家 5 月 18 日消息,Ayaneo 官方上周(5 月 14 日)在 Indiegogo 众筹平台发文,解释 NEXT 2 掌机停售后,此前预售订单的具体发货安排。 Ayaneo 表示,目前供应商已经开始生产 NEXT 2 的主板、屏幕、电池及其他核心部件,按照最新安排,

tech IT之家 2026-05-18 14:02:42+08:00

MathArena 认为竞赛题将不在是评估前沿 AI 数学能力的基准

去年 MathArena 发布了 MathArena Apex 和 Apex Shortlist 测试集,如今 GPT 5.5 已经解决了 Apex 测试集的最后一题。 Apex 和 Apex Shortlist 模型得分率随时间的变化 但是该测试集发布至今已有近一年的时间了,M

tech LinuxDo 最新话题 2026-05-17 12:20:55+08:00

企业接入模型 API 时,如何评估供应商稳定性和设计容灾方案?

最近在考虑企业业务中接入模型 API,想请教一下佬们怎么评估供应商对企业供应的稳定性,以及如何设计比较稳妥的接入架构。 我现在主要关心几个问题: 供应商稳定性应该怎么评估? 除了价格和模型效果以外,企业接入时应该重点看哪些指标 可用性 平均响应时间 P95 / P99 延迟 错误

tech LinuxDo 最新话题 2026-05-16 22:37:31+08:00

消息称苹果评估 AI 编程类应用入驻方案,担心恶意软件与收入流失

IT之家 5 月 14 日消息,科技媒体 The Information 昨日(5 月 13 日)报道,苹果公司正在内部讨论,如何在不触碰现有审核规则的前提下,让使用 AI Agent(智能体)的应用进入 App Store。 消息称开发者近年来在其 App 中大量整合 AI 元

tech IT之家 2026-05-14 07:04:18+08:00

vibo coding 一个全新的项目,如何设计一套系统 or 模式评估每轮会话的有效性

用了一年多的 cc,也使用过了 codex、cursor 等工具,引入过 trellis 等工具 但落地的时候仍会出现代码质量不可控的情况 一方面是需求澄清的不到位,也有自己提示词写的不好的原因 结果是 cc 乱写一通 现在业内有没有方案或者案例,管理整个开发的生命周期 能打开开

tech LinuxDo 最新话题 2026-05-13 17:32:03+08:00

感觉有了AI现在变得更累了..

感觉AI Coding比古法编程累多了 上午的一个需求排期,本来评估的5天,产品一句:“这个用AI几个小时就能生成吧”,排期当场被砍到2天。有了AI开发确实是快了,但问题也变多了。如:边界、权限、脏数据、线上兼容…最后还是得靠人来兜底。之前用cc opus4.6+codexgpt

tech LinuxDo 最新话题 2026-05-13 15:57:02+08:00

关于论文查AIGC的一些吐槽。

我的观点是我们没法用被验证的东西去做验证,所谓的AI评估AI永远需要一个AI之外的标准参照物,也就是人。但一个常识性的问题是,陪审团不能是被告本人啊。而当前神经网络黑箱的状态,不是里面藏了什么,而是里面没有可被定位的东西。所有的知道都分布在无数参数的相互作用里。我们需要一套不来自

tech LinuxDo 最新话题 2026-05-13 00:47:10+08:00

[职场话题] 感觉 AI Coding 比古法编程累多了

上午的一个需求排期,本来评估的 5 天,产品一句:“这个用 AI 几个小时就能生成吧”,排期当场被砍到 2 天。 有了 AI 开发确实是快了,但问题也变多了。如:边界、权限、脏数据、线上兼容...... 最后还是得靠人来兜底。 之前用 cc opus4.6 + codex gpt

tech v2ex 2026-05-12 15:30:02+08:00

[职场话题] 感觉 AI Coding 比古法编程累多了

上午的一个需求排期,本来评估的 5 天,产品一句:“这个用 AI 几个小时就能生成吧”,排期当场被砍到 2 天。 有了 AI 开发确实是快了,但问题也变多了。如:边界、权限、脏数据、线上兼容...... 最后还是得靠人来兜底。 之前用 cc opus4.6 + codex gpt

tech v2ex 2026-05-12 15:23:34+08:00

[职场话题] 感觉 AI Coding 比古法编程累多了

上午的一个需求排期,本来评估的 5 天,产品一句:“这个用 AI 几个小时就能生成吧”,排期当场被砍到 2 天。 有了 AI 开发确实是快了,但问题也变多了。如:边界、权限、脏数据、线上兼容...... 最后还是得靠人来兜底。 之前用 cc opus4.6 + codex gpt

tech v2ex 2026-05-12 15:08:48+08:00

[职场话题] 感觉 AI Coding 比古法编程累多了

上午的一个需求排期,本来评估的 5 天,产品一句:“这个用 AI 几个小时就能生成吧”,排期当场被砍到 2 天。 有了 AI 开发确实是快了,但问题也变多了。如:边界、权限、脏数据、线上兼容...... 最后还是得靠人来兜底。 之前用 cc opus4.6 + codex gpt

tech v2ex 2026-05-12 14:42:12+08:00