题目 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

题目 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 23 篇相关文章 · 第 1 / 2 页

感觉现在的AI用于学习貌似还是太难了

不知道是我自己用的方式有问题还是AI问题,我是最初打算用教材+题目+AI辅助的方式来学习一门高中课程。 用了几天后给我的感觉谁家AI都不是很好使,约束和提示搞不懂的话,你校对检查遗漏可能比你手动翻书或者电脑看PDF还花时间。目前AI给我的感觉就是讲解概念、解答一些题目还可以,但是

tech linux.do 2026-05-03 23:33:03+08:00

让ai优化的大模型高阶数学推理测试题,不知道效果如何

原题目为高中数学压轴题,经过GPT5.5改编如下,不知道效果如何 题目: AI 大模型高阶数学推理测试题 总说明: 本题由五个相互独立但结构相关的模块组成。 答题者需要给出完整推理过程。 仅给出结论不得满分。 本题重点考察: 1. 模运算与有限群上的分布; 2. 随机游走的首达时

tech linux.do 2026-05-02 23:38:01+08:00

ai在某些时候不如上人类吧

从一个题目我发现ai比人类慢,为了题目准确性,可以看我那个gemini无敌的帖子,我发现gemini虽然全部拼错,但是输出快,而且人类花脑子也很快就出答案,比ai快多了 再到目前,我在服务器和本地都开了个claude,我想要2者可以帮助我协同,实际上我更适合充当协调,如果让他们2

tech linux.do 2026-05-02 20:15:52+08:00

佬友们,有没有鉴定5.5模型的题目

感觉之前用的中转最近越来越难用了,感觉被偷偷路由到其它模型了,但是论坛里的测试题21,红绿色盲都能答对 13 个帖子 - 6 位参与者 阅读完整话题

tech linux.do 2026-05-02 19:38:32+08:00

gpt-5.3-codex优于gpt-5.4

就下面的测试 gpt-5.3-codex耗时2分钟出21和29(为了避免题目中的歧义,它自作主张补充说明了什么情况下是29),gpt-5.4耗时5分钟得出21。A畜家的忠实粉可以测一测这个题。 在一个黑色的袋子里放有三种口味的糖果,每种糖果有两种不同的形状(圆形和五角星形,不同的

tech linux.do 2026-04-28 18:55:57+08:00

我发现一个简单的问题,但是很多AI回答错误

题目 test.example.com { @authed { header Authorization "Bearer 123123123" } import log test.example.com import common reverse_proxy

tech linux.do 2026-04-26 19:23:52+08:00

Codedex题目翻译器

// ==UserScript== // @name Codedex 自动翻译(Chrome Translator API / Google 降级) // @namespace https://github.com/yourname/codedex-translator // @

tech linux.do 2026-04-26 17:03:26+08:00

[人工智能] 搞了个相当复杂的最优化问题去考验大模型,然后御三家的大模型全军覆灭

这是题目原文 获得补签卡有两种方式 - 600 记忆币兑换 1 张 - 6*0.91 元购买 1 张 获得会员有几种方式 - 10800 记忆币兑换 372 天 - 4000 记忆币兑换 93 天 - 2000 记忆币兑换 31 天 - 168*0.91 元购买 372 天(赠送

tech v2ex.com 2026-04-26 12:57:56+08:00

当初特意为grok4think出的双星问题 如今由Claude4.6o优雅解答

从 测了一下grok4think 史上最逆天的题目 全网页图解 继续讨论: 首先说上面那个话题里面的成果网站目前已经访问不了了,因为我账号没了 结果就是grok极致的冷酷无情,见题秒题(只是最终回答很简单,思考过程突破天际w),正确率很高 再回顾一下题目 **【问题背景】** 在

tech linux.do 2026-04-26 12:47:51+08:00

[人工智能] 搞了个相当复杂的最优化问题去考验大模型,然后御三家的大模型全军覆灭

这是题目原文 获得补签卡有两种方式 - 600 记忆币兑换 1 张 - 6*0.91 元购买 1 张 获得会员有几种方式 - 10800 记忆币兑换 372 天 - 4000 记忆币兑换 93 天 - 2000 记忆币兑换 31 天 - 168*0.91 元购买 372 天(赠送

tech v2ex.com 2026-04-26 11:42:01+08:00

[人工智能] 搞了个相当复杂的最优化问题去考验大模型,然后御三家的大模型全军覆灭

这是题目原文 获得补签卡有两种方式 - 600 记忆币兑换 1 张 - 6*0.91 元购买 1 张 获得会员有几种方式 - 10800 记忆币兑换 372 天 - 4000 记忆币兑换 93 天 - 2000 记忆币兑换 31 天 - 168*0.91 元购买 372 天(赠送

tech v2ex.com 2026-04-26 10:48:04+08:00

[人工智能] 搞了个相当复杂的最优化问题去考验大模型,然后御三家的大模型全军覆灭

这是题目原文 获得补签卡有两种方式 - 600 记忆币兑换 1 张 - 6*0.91 元购买 1 张 获得会员有几种方式 - 10800 记忆币兑换 372 天 - 4000 记忆币兑换 93 天 - 2000 记忆币兑换 31 天 - 168*0.91 元购买 372 天(赠送

tech v2ex.com 2026-04-26 05:59:36+08:00

[人工智能] 搞了个相当复杂的最优化问题去考验大模型,然后御三家的大模型全军覆灭

这是题目原文 获得补签卡有两种方式 - 600 记忆币兑换 1 张 - 6*0.91 元购买 1 张 获得会员有几种方式 - 10800 记忆币兑换 372 天 - 4000 记忆币兑换 93 天 - 2000 记忆币兑换 31 天 - 168*0.91 元购买 372 天(赠送

tech v2ex.com 2026-04-26 03:44:25+08:00

[人工智能] 搞了个相当复杂的最优化问题去考验大模型,然后御三家的大模型全军覆灭

这是题目原文 获得补签卡有两种方式 - 600 记忆币兑换 1 张 - 6*0.91 元购买 1 张 获得会员有几种方式 - 10800 记忆币兑换 372 天 - 4000 记忆币兑换 93 天 - 2000 记忆币兑换 31 天 - 168*0.91 元购买 372 天(赠送

tech v2ex.com 2026-04-26 03:44:25+08:00

给大家分享我 4 年元宵节原创的切小朋友分苹果算法题

看到最近比较火的分苹果题目,想到了之前出的题目,你说这巧不巧 一句话题意:n 个苹果 m 个小朋友,可以一刀切掉一个小朋友 / 一口吃一个苹果,求最少几次操作平分。 加载中... (学校OJ) 题解…已经忘了,不过可以试一试问 AI,有一个根号的做法,也有一个随机数据下期望 lo

tech linux.do 2026-04-25 10:46:26+08:00

deepseek v4 确实会偶发性弱智

从 一个弱智题目,DeepSeek v4是唯一一个完全错误的 继续讨论: 本来就是切死一个小朋友才能平分,照 ds 的切法反而不行了。 https://chat.deepseek.com/share/q1n0fd7k95rquabdjx 6 个帖子 - 6 位参与者 阅读完整话题

tech linux.do 2026-04-25 09:40:21+08:00

一个弱智题目,DeepSeek v4是唯一一个完全错误的

只用一刀,如何把4个蛋糕分给4个小朋友 只有 DeepSeek 输出了完全错误的答案 Gemini 和 GPT 都意识到了,根本不需要切 Grok 和 Kimi 虽然没意识到不需要切,但是说的也没有毛病 类比之前的洗车问题,会发现,顶尖的ai模型在处理低端弱智问题时往往会犯错 我

tech linux.do 2026-04-24 20:17:24+08:00

LINUX.DO都已经和这些平台平起平坐了吗

网易UU远程的调查文件,题目 25 个帖子 - 21 位参与者 阅读完整话题

tech linux.do 2026-04-24 17:44:48+08:00

DeepSeekV4 你怎么还退步了呢?

https://linux.do/t/topic/1696123?u=ytfl 具体题目见之前的帖子,之前评论区有DeepSeek网页版做对的,现在专家模式+深度思考反而做不对了 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-24 16:02:37+08:00

为 Deepseek 一个真正不懂会问的模型诞生而喜悦

这个题目一方面把询问的方式倒过来,一方面,容器R的定义是留白的。 容器r可以代表一个名字叫做r的容器,可以代表一个字母r。 它可以代表很多东西,我希望得到的答案是模型询问我,而不是自顾自的拟合出一个答案 只有DSV4能做到 恭喜。一个真正不懂会问的模型的诞生。 可能是雏形 题目:

tech linux.do 2026-04-24 14:13:07+08:00