计算题 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

计算题 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 8 篇相关文章

有了 agent 这种范式之后,语言大模型就不会算错基本的计算题了

以前都说 LLM 是推理下一个字符,所以有可能算错 10+11 这种最基本的计算题 现在似乎不会了,agent 的逻辑之下,LLM 会发现这是一个计算题,所以会当场写一个脚本再来算,就不会算错了 很多以前纯靠预测字符的方案难以解决的问题现在似乎都被解决了(至少不会再犯离谱的错误

tech V2EX - 技术 2026-05-17 14:59:36+08:00

有了 agent 这种范式之后,语言大模型就不会算错基本的计算题了

以前都说 LLM 是推理下一个字符,所以有可能算错 10+11 这种最基本的计算题 现在似乎不会了,agent 的逻辑之下,LLM 会发现这是一个计算题,所以会当场写一个脚本再来算,就不会算错了 很多以前纯靠预测字符的方案难以解决的问题现在似乎都被解决了(至少不会再犯离谱的错误

tech V2EX - 技术 2026-05-17 05:54:25+08:00

有了 agent 这种范式之后,语言大模型就不会算错基本的计算题了

以前都说 LLM 是推理下一个字符,所以有可能算错 10+11 这种最基本的计算题 现在似乎不会了,agent 的逻辑之下,LLM 会发现这是一个计算题,所以会当场写一个脚本再来算,就不会算错了 很多以前纯靠预测字符的方案难以解决的问题现在似乎都被解决了(至少不会再犯离谱的错误

tech V2EX - 技术 2026-05-16 18:54:15+08:00

有了 agent 这种范式之后,语言大模型就不会算错基本的计算题了

以前都说 LLM 是推理下一个字符,所以有可能算错 10+11 这种最基本的计算题 现在似乎不会了,agent 的逻辑之下,LLM 会发现这是一个计算题,所以会当场写一个脚本再来算,就不会算错了 很多以前纯靠预测字符的方案难以解决的问题现在似乎都被解决了(至少不会再犯离谱的错误

tech V2EX - 技术 2026-05-16 17:54:15+08:00

有了 agent 这种范式之后,语言大模型就不会算错基本的计算题了

以前都说 LLM 是推理下一个字符,所以有可能算错 10+11 这种最基本的计算题 现在似乎不会了,agent 的逻辑之下,LLM 会发现这是一个计算题,所以会当场写一个脚本再来算,就不会算错了 很多以前纯靠预测字符的方案难以解决的问题现在似乎都被解决了(至少不会再犯离谱的错误

tech V2EX - 技术 2026-05-16 17:21:37+08:00

有了 agent 这种范式之后,语言大模型就不会算错基本的计算题了

以前都说 LLM 是推理下一个字符,所以有可能算错 10+11 这种最基本的计算题 现在似乎不会了,agent 的逻辑之下,LLM 会发现这是一个计算题,所以会当场写一个脚本再来算,就不会算错了 很多以前纯靠预测字符的方案难以解决的问题现在似乎都被解决了(至少不会再犯离谱的错误

tech V2EX - 技术 2026-05-16 17:01:06+08:00

有了 agent 这种范式之后,语言大模型就不会算错基本的计算题了

以前都说 LLM 是推理下一个字符,所以有可能算错 10+11 这种最基本的计算题 现在似乎不会了,agent 的逻辑之下,LLM 会发现这是一个计算题,所以会当场写一个脚本再来算,就不会算错了 很多以前纯靠预测字符的方案难以解决的问题现在似乎都被解决了(至少不会再犯离谱的错误

tech V2EX - 技术 2026-05-16 16:09:15+08:00

用来测试claude的超难数学题被Deepseek做出来了

这是题目: 首先我想请你回答一道困难的计算题。设实数列\{x_n\}满足:x_0=0,x_2= \sqrt[3]{2}x_1,x_3 是正整数,且 [x_{n+1} = \frac{1}{\sqrt[3]{4}} x_n + \sqrt[3]{4} x_{n-1} + \frac

tech LinuxDo 最新话题 2026-05-15 17:14:01+08:00