Grok 4.3悄悄上线 跑分评测出炉
Grok 4.3 是 xAI 一次务实升级:更便宜、更快、更像能干活的助手。但它在硬推理、稳定性和可信度上,仍落后 GPT-5.5 与 Claude Opus 4.7。xAI 发布 Grok 4.3,没有把声量拉到最大,马斯克甚至没单独发推,看起来只是个过渡版本。 https:/
推理 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 103 篇相关文章 · 第 1 / 6 页
Grok 4.3 是 xAI 一次务实升级:更便宜、更快、更像能干活的助手。但它在硬推理、稳定性和可信度上,仍落后 GPT-5.5 与 Claude Opus 4.7。xAI 发布 Grok 4.3,没有把声量拉到最大,马斯克甚至没单独发推,看起来只是个过渡版本。 https:/
https://tps.bunai.cc/ranking?gpu=apple_m5_32g&ic=nvlink5
https://tps.bunai.cc/ranking?gpu=apple_m5_32g&ic=nvlink5
有一天,一个女孩参加数学考试只得了 38 分。她心里对父亲的惩罚充满恐惧,于是偷偷把分数改成了 88 分。她的父亲看到试卷后,怒发冲冠,狠狠地给了她巴掌,怒吼道:" 你这 8 怎么一半是绿的一半是红的,你以为我是傻子吗?" 女孩被打后,委屈地哭了起来,什么也没
原题目为高中数学压轴题,经过GPT5.5改编如下,不知道效果如何 题目: AI 大模型高阶数学推理测试题 总说明: 本题由五个相互独立但结构相关的模块组成。 答题者需要给出完整推理过程。 仅给出结论不得满分。 本题重点考察: 1. 模运算与有限群上的分布; 2. 随机游走的首达时
gpt最近封控严重啊,deepseek工程能力只相当于sonnet,但是能不能用于复杂推理任务呢,比如架构设计之类的。 10 个帖子 - 7 位参与者 阅读完整话题
DeepSeek在GitHub上发布了多模态推理模型及技术报告,题为《Thinking with Visual Primitives(以视觉原语思考)》。 该模型基于DeepSeek V4-Flash(284B总参数、推理时激活13B的MoE架构)构建,提出了一种全新的多模态推理
DeepSeek联合北京大学、清华大学发布论文《Thinking with Visual Primitives》及其开源仓库,提出一种新的多模态推理框架。该框架的核心做法是将空间标记——坐标点和边界框——提升为模型思维链中的“ 最小思考单元 ”,在推理过程中直接交织使用,使模型在
最近刚加一个,结果pro的号都封降智了,用它来推理理论好好用,求一个 补充:单独开pro太贵了,泪目,拼车也可以找我 个人用下来感觉opus没有pro好用 6 个帖子 - 3 位参与者 阅读完整话题
《医道官途》,1296 章,1000 万字。我问 AI:乔梦媛的亲生父亲究竟是谁?说说前因后果。书里从来没有直接说过答案。AI 自己搜原文、追线索、识破了一个贯穿全书的误导,最后推理出来了。整个过程大概两分钟。 没有任何一段原文直接说出这个答案。AI 是从四个跨度超过 200 章
《医道官途》,1296 章,1000 万字。我问 AI:乔梦媛的亲生父亲究竟是谁?说说前因后果。书里从来没有直接说过答案。AI 自己搜原文、追线索、识破了一个贯穿全书的误导,最后推理出来了。整个过程大概两分钟。 没有任何一段原文直接说出这个答案。AI 是从四个跨度超过 200 章
《医道官途》,1296 章,1000 万字。我问 AI:乔梦媛的亲生父亲究竟是谁?说说前因后果。书里从来没有直接说过答案。AI 自己搜原文、追线索、识破了一个贯穿全书的误导,最后推理出来了。整个过程大概两分钟。 没有任何一段原文直接说出这个答案。AI 是从四个跨度超过 200 章
IT之家 4 月 30 日消息,苹果公司携手加州大学圣迭戈分校团队,在新版论文《LaDiR:潜在扩散增强 LLM 文本推理》中提出新框架, 让大语言模型(LLM)在回答前并行探索多条推理路径,再用自回归方式输出提高结果质量。 IT之家援引博文介绍,该框架并非新模型,而是叠加在现有
各位佬,中转站的openai 接口之前一直是/v1/responses,一直能看到推理强度是XHIGH,昨天突然变成了/v1/chat/completions,而且看不到推理强度了,这说明了什么问题 1 个帖子 - 1 位参与者 阅读完整话题
IT之家 4 月 29 日消息,国家数据局数据显示,2025 年,我国用于人工智能训练和推理的数据总量为 199.48EB(Exabyte,艾字节 | 1EB=1024PB=1,048,576TB),同比增长 42.86%, 推理数据量首超训练数据量 ,达 101.34EB。 另
搞点rust推理后端…cpu要飞起来了…llm也是一窍不通 1 个帖子 - 1 位参与者 阅读完整话题
功能亮点 完全本地推理与存储,不依赖网络 不依赖 GPU ,CPU 速度飞快 功能介绍 CPU 飞快 i5-11400H:30min 的音频 1min 就能处理完(五年前的 CPU ) i5-4210m:30min 的音频 3min 就能处理完(十年前的 CPU ) 实时识别 支
功能亮点 完全本地推理与存储,不依赖网络 不依赖 GPU ,CPU 速度飞快 功能介绍 CPU 飞快 i5-11400H:30min 的音频 1min 就能处理完(五年前的 CPU ) i5-4210m:30min 的音频 3min 就能处理完(十年前的 CPU ) 实时识别 支
功能亮点 完全本地推理与存储,不依赖网络 不依赖 GPU ,CPU 速度飞快 功能介绍 CPU 飞快 i5-11400H:30min 的音频 1min 就能处理完(五年前的 CPU ) i5-4210m:30min 的音频 3min 就能处理完(十年前的 CPU ) 实时识别 支
gpt把instant和thinking模型区分开了,虽然复杂问题可以自动切换至thinking,但本质上是换了模型,有割裂感,不过这样好处是两类模型术业有专攻。而claude没有区分,由模型自己决定思考深度,体验上更统一,佬们觉得哪种模式好?我个人体感claude家的技术路线似