基准 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

基准 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 22 篇相关文章 · 第 1 / 2 页

[分享创造] Pilates 2.0:纯 TS flex 布局引擎,9 个基准都比 WASM Yoga 快

最近在做一个终端 UI 的 flex 布局引擎,叫 Pilates 。纯 TypeScript,零运行时依赖,跟 Ink 用的 WASM Yoga(Facebook 的 flex 引擎,C++ 编译成 WASM)对照过 33 个 oracle fixture 加一个结构化 fuz

tech v2ex 2026-05-23 15:25:47+08:00

MathArena 认为竞赛题将不在是评估前沿 AI 数学能力的基准

去年 MathArena 发布了 MathArena Apex 和 Apex Shortlist 测试集,如今 GPT 5.5 已经解决了 Apex 测试集的最后一题。 Apex 和 Apex Shortlist 模型得分率随时间的变化 但是该测试集发布至今已有近一年的时间了,M

tech LinuxDo 最新话题 2026-05-17 12:20:55+08:00

特斯拉Model Y成首款通过美国全新驾驶辅助安全基准的车型

美国国家公路交通安全管理局(NHTSA)本周二表示,后期推出的2026款特斯拉Model Y,成为首款符合该机构全新高级驾驶辅助系统(ADAS)安全基准的车型。 新标准由NHTSA纳入其安全评级体系,旨在更系统地评估车辆在多类驾驶辅助场景下的实际安全表现。 根据NHTSA介绍,其

tech cnBeta全文版 2026-05-09 15:06:22+08:00

哈维律师事务所 发布 长期法律Agent基准测试

Harvey Introducing Harvey’s Legal Agent Benchmark Harvey’s Legal Agent Benchmark is an open-source benchmark built to evaluate and improve a

tech LinuxDo 最新话题 2026-05-07 09:55:48+08:00

SPEC CPU 2026 基准测试套件发布:体现现代硬软件重大演进

IT之家 5 月 6 日消息,SPEC 美国弗吉尼亚州当地时间 5 日宣布推出 SPEC CPU 2026 基准测试套件。该测试是对此前 SPEC CPU 2017 的重大迭代更新, 充分体现了当今现代硬件和软件的重大演进 。 SPEC CPU 2026 包含 52 个基准测试,

tech www.ithome.com 2026-05-06 09:20:22+08:00

UL Solutions 推出 Procyon Essentials 基准测试:面向日常专业工作负载

IT之家 5 月 6 日消息,UL Solutions 当地时间 5 日宣布推出 Procyon Essentials 基准测试。这一工具可视为 PCMark 10 在一定意义上的“精神继任者”, 主要评估电脑硬件在专业人士日常工作真实负载中的表现 ,侧重于多任务处理和网页浏览。

tech www.ithome.com 2026-05-06 09:11:29+08:00

AMD 锐龙 9 PRO 9965X3D 商用 3D V-Cache 处理器现身基准测试

IT之家 5 月 4 日消息,AMD 首款 MSDT 级商用 3D V-Cache 处理器锐龙 9 PRO 9965X3D 的传闻至少可追溯到 2025 年 11 月,而在半年之后 这一型号也终于出现在了 PassMark 基准测试数据库中 : 可以看到 PassMark 对这款

tech www.ithome.com 2026-05-04 12:43:00+08:00

3DMark macOS独立版终于发布:不用苹果商店、离线也能跑

知名基准测试软件3DMark的开发商UL Solutions近日推出macOS独立版应用,用户从此可以直接从官网下载软件并激活授权,不再受限于苹果商店这一发行渠道。 早在去年六月的WWDC期间,UL Solutions首次将3DMark带入macOS生态,但长期依赖App Sto

tech plink.anyfeeder.com 2026-04-25 15:35:56+08:00

全球第三:我国建成新一代激光波长量子基准,量值溯源实现自主可控

IT之家 4 月 24 日消息,据央视新闻今日报道,我国成功研制并获批新建国家光波长量子基准,总体技术达到国际先进水平。 计量基准是一个国家测量体系的“定盘星”。在此之前,我国的光波长计量长期依赖单点波长基准,测量范围窄、精度有限。 为突破光波长量子计量量值溯源领域的关键技术瓶颈

tech www.ithome.com 2026-04-24 20:15:19+08:00

GPT-5.5的编程能力如何

看基准测试是有进步的,不知道各位的感受如何,最关心的是能不能开1M,5.4开1M的话那个注意力都不知道飘哪里去了 16 个帖子 - 9 位参与者 阅读完整话题

tech linux.do 2026-04-24 18:12:00+08:00

DeepSeek-V4-Pro Benchmark简单解读

加粗 为该行最高分。 类别 基准测试 指标 测什么 DS-V4-Pro Max DS-V4-Flash Max Kimi K2.6 GLM-5.1 Opus 4.6 Max GPT-5.4 xHigh Gemini 3.1 Pro High 知识与推理 MMLU-Pro EM 5

tech linux.do 2026-04-24 16:54:54+08:00

Kimi K2.6 的基准测试对比图

4 个帖子 - 4 位参与者 阅读完整话题

tech linux.do 2026-04-21 10:51:19+08:00

快讯:Qwen3.6-Max模型发布,在六项主要编程基准上取得最高分

ithome.com 新一代“家族旗舰”:阿里 Qwen 3.6-Max 预览版发布 - IT之家 据介绍,该模型是新一代千问旗舰模型的早期预览版,用户可以在 Qwen Studio 进行交互对话,并且即将通过阿里云百炼 API 以 qwen3.6-max-preview 的名称

tech linux.do 2026-04-20 15:58:09+08:00

Deepseek x上传出来的,各位佬友分析下

帖子内容: 疑似 DeepSeek V4 技术报告的 benchmark泄露! 图中 的“DeepSeek-V4 技术报告”基准测试(Benchmark)数据,为我们揭示了当前顶尖 AI 大模型的最新竞争格局。从这份涵盖通用能力、推理数学、代码以及智能体(Agent)四大维度的成

tech linux.do 2026-04-17 20:18:19+08:00

印尼央行加息50个基点至5.25%

印度尼西亚银行(印尼央行)5月20日宣布,将基准利率上调50个基点至5.25%,加息幅度高于市场预期。这是印尼央行自2024年4月以来首次加息,该利率自去年9月以来一直维持在4.75%水平。印尼央行当天在结束为期两天的理事会会议后发表声明表示,此次加息旨在增强印尼盾汇率稳定性,并

tech 36氪

存量产品将批量调整业绩比较基准,提高投资管理适配度迫在眉睫

6月1日起,公募行业将迎来首批存量产品批量调整业绩比较基准,投资更加灵活的主动权益基金成为此次基准调整的重要阵地,不仅基准涉及的权益指数进一步细化,而且权益指数的权重也普遍被校准,以更加贴合基金产品的实际投资风格。与此同时,记者注意到,近期多家头部公募机构正在加紧调整主动权益基金

tech 36氪

公募存量产品将批量调整业绩比较基准

6月1日起,公募行业将迎来首批存量产品批量调整业绩比较基准,投资更加灵活的主动权益基金成为此次基准调整的重要阵地,不仅基准涉及的权益指数进一步细化,而且权益指数的权重也普遍被校准,以更加贴合基金产品的实际投资风格。与此同时,近期多家头部公募机构正在加紧调整主动权益基金等产品的基金

tech 36氪

中信证券:美国二次通胀风险较小,基准情形下仍预计美联储年内降息25bps

36氪获悉,中信证券研报称,我们认为美国二次通胀风险较小,但高油价将掣肘年内通胀率的回落空间,基准情形下仍预计美联储年内降息25bps。美债目前更适合交易型机会,美股在强劲的财报季接近收官后需留意资金获利了结的短期风险,美元指数可能在100以下偏弱震荡但非持续下行。

tech 36氪

百度搭子DuMate登顶PinchBench

36氪获悉,5月8日凌晨,百度搭子DuMate登顶智能体评测基准PinchBench榜首,并在前5位中占据3席。据了解,在另外一项DeepResearch深度研究榜单中,DuMate同样位列第一。

tech 36氪

汇丰控股:一季度收入同比增加6%至186亿美元

5月5日午间,汇丰控股在港交所公告,2026年第一季度列账基准除税前利润同比减少1亿美元至94亿美元;收入同比增加10亿美元至186亿美元,增幅为6%。董事会已通过派发2026年第⼀次股息每股0.1美元。(21经济网)

tech 36kr.com