幻觉 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技

qwen3.7-max一上来就给我整活

差点以为被提示词注入攻击了，结果是幻觉（这个url确实不存在）也没有查到有关iot-3d-printer-monitor的任何项目。用的OpenCode加载了superpowers插件，之前deepseek-v4-pro也幻觉过，莫名其妙调用了B站搜索MCP 2 个帖子 - 2

tech LinuxDo 最新话题 2026-05-23 20:14:45+08:00

我要收回曾经一切对梁圣的不敬之词

我要收回我曾经所有对deepseek和梁文峰的不敬之辞。之前黑deepseek迭代慢幻觉率高，都是小孩子不懂事闹着玩的。如果有问题，那一定是我的问题，而不是deepseek的问题。 1 个帖子 - 1 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-23 20:09:44+08:00

我觉得 AI 幻觉可能是避免不了的了，这也许就是人类工程师还存在的理由？

现在都说要跟 AI 打好配合，提升工作效率。但是我用了这么久下来，发现 AI 幻觉是避免不了的，只是或多或少的问题。比方说你要搭一套 RAG 系统，或者给 Agent 接上公司内部知识库，测试的时候看起来还行，但一遇到真实的文档，比方说一份产品规格书，一份带多级嵌套表格的金融年

tech V2EX - 技术 2026-05-23 12:28:19+08:00

我觉得 AI 幻觉可能是避免不了的了，这也许就是人类工程师还存在的理由？

现在都说要跟 AI 打好配合，提升工作效率。但是我用了这么久下来，发现 AI 幻觉是避免不了的，只是或多或少的问题。比方说你要搭一套 RAG 系统，或者给 Agent 接上公司内部知识库，测试的时候看起来还行，但一遇到真实的文档，比方说一份产品规格书，一份带多级嵌套表格的金融年

tech V2EX - 技术 2026-05-23 04:23:36+08:00

我觉得 AI 幻觉可能是避免不了的了，这也许就是人类工程师还存在的理由？

现在都说要跟 AI 打好配合，提升工作效率。但是我用了这么久下来，发现 AI 幻觉是避免不了的，只是或多或少的问题。比方说你要搭一套 RAG 系统，或者给 Agent 接上公司内部知识库，测试的时候看起来还行，但一遇到真实的文档，比方说一份产品规格书，一份带多级嵌套表格的金融年

tech V2EX - 技术 2026-05-22 18:16:46+08:00

Gemini3.5-flash不开Extended出现了幻觉？

如图 1.首先Gemini 告诉我，300+140=460是对的，等于440是错的 2.然后Gemini验算了一遍，验算的结果是440 3.最后来了一句：所以结果确实是 440。各位佬，你们的Gemini是不是这样啊补充：开了Extended的模式之后这回对味了 28 个

tech LinuxDo 最新话题 2026-05-21 13:20:51+08:00

gemini 3.5 flash这个幻觉是不是有点严重

gemini这个幻觉把我吓哭了让它把国际新闻汇总给我，胡言乱语了已经。 1 个帖子 - 1 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-21 10:11:05+08:00

沉迷于优化工作流怎么办，产出是产出不了一点，进来看看我的工作流

各种Spec,Harness用了个遍被各种幻觉折磨的不行，最后发现还是回归基本功比较好，用最基础的Plan+执行模式。目前正在构建下面这种工作流：提案循环：提示词输入 → 生成方案 → 多个AI评审 → 人工评审 → 提示词输入…循环得到最终方案执行和AI评审循环：执行 →

tech LinuxDo 最新话题 2026-05-20 16:14:31+08:00

AI幻觉问题

佬们，想问下ai幻觉问题怎么避免比较好，家里老人也用上豆包了，但是不知道ai幻觉这种问题，比如说还问豆包哪有修手表的地方这种问题，豆包说在商场地下室一层，结果是停车场，这种要怎么避免，不太懂现在的大模型，可以仿照那种视觉模型一样在提示词里加个置信度这种吗？还有豆包也不是很靠谱，像

tech LinuxDo 最新话题 2026-05-20 16:13:01+08:00

Gemini 3.5 Flash-Extend 幻觉极其严重，形式远远大于内容

prompt: 我的意思是说抽象的看，两者其实都是外挂啊，你拿Qwen3-ForcedAligner对标wav2vec2比架构先进性，就好比成人对标小孩，wav2vec2都是十几年前的了！！！所以我说嘛，半斤八两，在现代各种范式架构成熟情况下，放条狗都能做出来，这有啥好夸的呢

tech LinuxDo 最新话题 2026-05-20 15:49:47+08:00

这是一盒神奇巧克力

这是一盒神奇巧克力，吃完有概率出现以下情况：提高工作效率、出现降智、幻觉、以及巧克力每周刷新一次 1 个帖子 - 1 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-20 10:14:17+08:00

Gemini 3.5 Flash初体验: 快, 幻觉, 和嘴硬

得益于 Antigravity CLi 的问世, Gemini CLI进入了坟墓, 而人们终于有机会用 agy -p 来调用 claude opus 4.6 而不怕被 Anthropic 封号. 但那不重要, 在很快的用完了我的 claude 5h 限额后, 我开始用 Gemin

tech LinuxDo 最新话题 2026-05-20 09:53:56+08:00

Gemini新版网页端为什么搜索还是这么差？

Gemini网页版的搜索一直体验极差幻觉极高甚至一度怀疑前端根本没做搜索功能 Gemini App偶尔会显示在搜索，网页版从来都不会显示搜索现在更新了新版UI 网页版终于会显示搜索了然而。。 pro+新版web端持续拒绝回答？？？ flash（或许是3.5或许是3）+新

tech LinuxDo 最新话题 2026-05-20 02:41:09+08:00

DeepSeek回应“乱回”漏洞：特殊字符引发模型幻觉不涉及安全问题或隐私泄露

5月19日，DeepSeek官方账号发布《关于字符触发模型异常回复的说明》：近期，我们关注到有用户反馈，在与DeepSeek模型的对话中输入“ ”这类特殊字符后，模型偶发返回不可预期的内容，使部分用户产生了“对话泄露”的疑虑。针对这一问题，我们的技术团队经全面排查后，发现：输

tech cnBeta全文版 2026-05-20 02:35:13+08:00

今日 DeepSeek 就“<think> 字符触发模型异常回复”发布说明，官方称：属于特殊字符引发的模型幻觉，不涉及安全问题或隐私泄露。

关于近期，我们关注到有用户反馈，在与 DeepSeek 模型的对话中输入“”这类特殊字符后，模型偶发返回不可预期的内容，使部分用户产生了“对话泄露”的疑虑。针对这一问题，我们的技术团队经全面排查后发现：输入“”等字符触发返回异常内容，属于特殊字符引发的模型幻觉，不涉及安全问题

tech LinuxDo 最新话题 2026-05-19 18:53:41+08:00

DeepSeek 回应字符触发模型异常：系特殊字符引发幻觉，不涉及安全问题或隐私泄露

IT之家 5 月 19 日消息，今日 DeepSeek 就“<think> 字符触发模型异常回复”发布说明，官方称：属于特殊字符引发的模型幻觉，不涉及安全问题或隐私泄露。 IT之家附声明全文如下：关于 <think> 字符触发模型异常回复的说明近期，我

tech IT之家 2026-05-19 18:32:38+08:00

gemini-3.5flash，这是幻觉吗

看到佬们说是谷歌家出了新模型，急头白脸的去下了反重力，然后试了一下让新模型给我项目找bug，结果它告诉我一个我的项目中不存在的子工具。这是幻觉吗？ 6 个帖子 - 3 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-19 02:07:06+08:00

deepseek 在小红书发布了角色扮演反馈贴

下午三点多发的。其他领域的反馈，比如小说，公文，幻觉，搜索，代码等，也可以向小红书贴主陈小礼反馈，后续和同事同步。小红书链接小红书 - 你的生活兴趣社区也可发送到邮箱 victorchen@deepseek.com 12 个帖子 - 8 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-18 16:58:08+08:00

[慢讯-已被教育] Deepseek <think bug

如图, 空会话输入<think, 看起来像是进入了谁的会话碎片? 原来是幻觉 7 个帖子 - 6 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-17 19:34:10+08:00

【LLM幻觉】LLM使用第一课，不要完全信任LLM输出的东西

看到大量讨论LLM幻觉但事先不知道是幻觉的帖子有感而发 Gemini和ChatGPT的回答最下面写着这么一行字，他这么写是有他的道理的 LLM是有幻觉的，尽管2026年了幻觉表面看起来已经很少了，但不代表它没有幻觉了但是很多佬友经常忽视了这个前提所以经常会疑惑然后发帖比如经

tech LinuxDo 最新话题 2026-05-15 10:30:12+08:00

幻觉 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

相关标签