幻觉 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

幻觉 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 93 篇相关文章 · 第 1 / 5 页

qwen3.7-max一上来就给我整活

差点以为被提示词注入攻击了,结果是幻觉(这个url确实不存在)也没有查到有关iot-3d-printer-monitor的任何项目。 用的OpenCode加载了superpowers插件,之前deepseek-v4-pro也幻觉过,莫名其妙调用了B站搜索MCP 2 个帖子 - 2

tech LinuxDo 最新话题 2026-05-23 20:14:45+08:00

我要收回曾经一切对梁圣的不敬之词

我要收回我曾经所有对deepseek和梁文峰的不敬之辞。之前黑deepseek迭代慢幻觉率高,都是小孩子不懂事闹着玩的。如果有问题,那一定是我的问题,而不是deepseek的问题。 1 个帖子 - 1 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-23 20:09:44+08:00

我觉得 AI 幻觉可能是避免不了的了,这也许就是人类工程师还存在的理由?

现在都说要跟 AI 打好配合,提升工作效率。但是我用了这么久下来,发现 AI 幻觉是避免不了的,只是或多或少的问题。 比方说你要搭一套 RAG 系统,或者给 Agent 接上公司内部知识库,测试的时候看起来还行,但一遇到真实的文档,比方说一份产品规格书,一份带多级嵌套表格的金融年

tech V2EX - 技术 2026-05-23 12:28:19+08:00

我觉得 AI 幻觉可能是避免不了的了,这也许就是人类工程师还存在的理由?

现在都说要跟 AI 打好配合,提升工作效率。但是我用了这么久下来,发现 AI 幻觉是避免不了的,只是或多或少的问题。 比方说你要搭一套 RAG 系统,或者给 Agent 接上公司内部知识库,测试的时候看起来还行,但一遇到真实的文档,比方说一份产品规格书,一份带多级嵌套表格的金融年

tech V2EX - 技术 2026-05-23 04:23:36+08:00

我觉得 AI 幻觉可能是避免不了的了,这也许就是人类工程师还存在的理由?

现在都说要跟 AI 打好配合,提升工作效率。但是我用了这么久下来,发现 AI 幻觉是避免不了的,只是或多或少的问题。 比方说你要搭一套 RAG 系统,或者给 Agent 接上公司内部知识库,测试的时候看起来还行,但一遇到真实的文档,比方说一份产品规格书,一份带多级嵌套表格的金融年

tech V2EX - 技术 2026-05-22 18:16:46+08:00

Gemini3.5-flash不开Extended出现了幻觉?

如图 1.首先Gemini 告诉我,300+140=460是对的 ,等于440是错的 2.然后Gemini验算了一遍,验算的结果是440 3.最后来了一句:所以结果确实是 440。 各位佬,你们的Gemini是不是这样啊 补充:开了Extended的模式之后 这回对味了 28 个

tech LinuxDo 最新话题 2026-05-21 13:20:51+08:00

gemini 3.5 flash这个幻觉是不是有点严重

gemini这个幻觉把我吓哭了 让它把国际新闻汇总给我,胡言乱语了已经。 1 个帖子 - 1 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-21 10:11:05+08:00

沉迷于优化工作流怎么办,产出是产出不了一点,进来看看我的工作流

各种Spec,Harness用了个遍被各种幻觉折磨的不行,最后发现还是回归基本功比较好,用最基础的Plan+执行模式。目前正在构建下面这种工作流: 提案循环:提示词输入 → 生成方案 → 多个AI评审 → 人工评审 → 提示词输入…循环得到最终方案 执行和AI评审循环:执行 →

tech LinuxDo 最新话题 2026-05-20 16:14:31+08:00

AI幻觉问题

佬们,想问下ai幻觉问题怎么避免比较好,家里老人也用上豆包了,但是不知道ai幻觉这种问题,比如说还问豆包哪有修手表的地方这种问题,豆包说在商场地下室一层,结果是停车场,这种要怎么避免,不太懂现在的大模型,可以仿照那种视觉模型一样在提示词里加个置信度这种吗?还有豆包也不是很靠谱,像

tech LinuxDo 最新话题 2026-05-20 16:13:01+08:00

Gemini 3.5 Flash-Extend 幻觉极其严重,形式远远大于内容

prompt: 我的意思是说抽象的看,两者其实都是外挂啊,你拿Qwen3-ForcedAligner对标wav2vec2比架构先进性,就好比成人对标小孩 ,wav2vec2都是十几年前的了!!! 所以我说嘛,半斤八两,在现代各种范式架构成熟情况下,放条狗都能做出来,这有啥好夸的呢

tech LinuxDo 最新话题 2026-05-20 15:49:47+08:00

这是一盒神奇巧克力

这是一盒神奇巧克力,吃完有概率出现以下情况:提高工作效率、出现降智、幻觉、以及巧克力每周刷新一次 1 个帖子 - 1 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-20 10:14:17+08:00

Gemini 3.5 Flash初体验: 快, 幻觉, 和嘴硬

得益于 Antigravity CLi 的问世, Gemini CLI进入了坟墓, 而人们终于有机会用 agy -p 来调用 claude opus 4.6 而不怕被 Anthropic 封号. 但那不重要, 在很快的用完了我的 claude 5h 限额后, 我开始用 Gemin

tech LinuxDo 最新话题 2026-05-20 09:53:56+08:00

Gemini新版网页端为什么搜索还是这么差?

Gemini网页版的搜索一直体验极差 幻觉极高 甚至一度怀疑前端根本没做搜索功能 Gemini App偶尔会显示在搜索,网页版从来都不会显示搜索 现在更新了新版UI 网页版终于会显示搜索了 然而。。 pro+新版web端 持续拒绝回答??? flash(或许是3.5或许是3)+新

tech LinuxDo 最新话题 2026-05-20 02:41:09+08:00

DeepSeek回应“乱回”漏洞:特殊字符引发模型幻觉 不涉及安全问题或隐私泄露

5月19日,DeepSeek官方账号发布《关于 字符触发模型异常回复的说明》:近期,我们关注到有用户反馈,在与DeepSeek模型的对话中输入“ ”这类特殊字符后,模型偶发返回不可预期的内容,使部分用户产生了“对话泄露”的疑虑。针对这一问题,我们的技术团队经全面排查后,发现: 输

tech cnBeta全文版 2026-05-20 02:35:13+08:00

今日 DeepSeek 就“<think> 字符触发模型异常回复”发布说明,官方称:属于特殊字符引发的模型幻觉,不涉及安全问题或隐私泄露。

关于 近期,我们关注到有用户反馈,在与 DeepSeek 模型的对话中输入“”这类特殊字符后,模型偶发返回不可预期的内容,使部分用户产生了“对话泄露”的疑虑。针对这一问题,我们的技术团队经全面排查后发现: 输入“”等字符触发返回异常内容,属于特殊字符引发的模型幻觉,不涉及安全问题

tech LinuxDo 最新话题 2026-05-19 18:53:41+08:00

DeepSeek 回应字符触发模型异常:系特殊字符引发幻觉,不涉及安全问题或隐私泄露

IT之家 5 月 19 日消息,今日 DeepSeek 就“<think> 字符触发模型异常回复”发布说明,官方称:属于特殊字符引发的模型幻觉,不涉及安全问题或隐私泄露。 IT之家附声明全文如下: 关于 <think> 字符触发模型异常回复的说明 近期,我

tech IT之家 2026-05-19 18:32:38+08:00

gemini-3.5flash,这是幻觉吗

看到佬们说是谷歌家出了新模型,急头白脸的去下了反重力,然后试了一下让新模型给我项目找bug,结果它告诉我一个我的项目中不存在的子工具。这是幻觉吗? 6 个帖子 - 3 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-19 02:07:06+08:00

deepseek 在小红书发布了角色扮演反馈贴

下午三点多发的。 其他领域的反馈,比如小说,公文,幻觉,搜索,代码等,也可以向小红书贴主陈小礼反馈,后续和同事同步。 小红书链接 小红书 - 你的生活兴趣社区 也可发送到邮箱 victorchen@deepseek.com 12 个帖子 - 8 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-18 16:58:08+08:00

[慢讯-已被教育] Deepseek <think bug

如图, 空会话输入<think, 看起来像是进入了谁的会话碎片? 原来是幻觉 7 个帖子 - 6 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-17 19:34:10+08:00

【LLM幻觉】LLM使用第一课,不要完全信任LLM输出的东西

看到大量讨论LLM幻觉但事先不知道是幻觉的帖子有感而发 Gemini和ChatGPT的回答最下面写着这么一行字,他这么写是有他的道理的 LLM是有幻觉的,尽管2026年了幻觉表面看起来已经很少了,但不代表它没有幻觉了 但是很多佬友经常忽视了这个前提 所以经常会疑惑然后发帖 比如经

tech LinuxDo 最新话题 2026-05-15 10:30:12+08:00