qwen3.7-max一上来就给我整活
差点以为被提示词注入攻击了,结果是幻觉(这个url确实不存在)也没有查到有关iot-3d-printer-monitor的任何项目。 用的OpenCode加载了superpowers插件,之前deepseek-v4-pro也幻觉过,莫名其妙调用了B站搜索MCP 2 个帖子 - 2
幻觉 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 93 篇相关文章 · 第 1 / 5 页
差点以为被提示词注入攻击了,结果是幻觉(这个url确实不存在)也没有查到有关iot-3d-printer-monitor的任何项目。 用的OpenCode加载了superpowers插件,之前deepseek-v4-pro也幻觉过,莫名其妙调用了B站搜索MCP 2 个帖子 - 2
我要收回我曾经所有对deepseek和梁文峰的不敬之辞。之前黑deepseek迭代慢幻觉率高,都是小孩子不懂事闹着玩的。如果有问题,那一定是我的问题,而不是deepseek的问题。 1 个帖子 - 1 位参与者 阅读完整话题
现在都说要跟 AI 打好配合,提升工作效率。但是我用了这么久下来,发现 AI 幻觉是避免不了的,只是或多或少的问题。 比方说你要搭一套 RAG 系统,或者给 Agent 接上公司内部知识库,测试的时候看起来还行,但一遇到真实的文档,比方说一份产品规格书,一份带多级嵌套表格的金融年
现在都说要跟 AI 打好配合,提升工作效率。但是我用了这么久下来,发现 AI 幻觉是避免不了的,只是或多或少的问题。 比方说你要搭一套 RAG 系统,或者给 Agent 接上公司内部知识库,测试的时候看起来还行,但一遇到真实的文档,比方说一份产品规格书,一份带多级嵌套表格的金融年
现在都说要跟 AI 打好配合,提升工作效率。但是我用了这么久下来,发现 AI 幻觉是避免不了的,只是或多或少的问题。 比方说你要搭一套 RAG 系统,或者给 Agent 接上公司内部知识库,测试的时候看起来还行,但一遇到真实的文档,比方说一份产品规格书,一份带多级嵌套表格的金融年
如图 1.首先Gemini 告诉我,300+140=460是对的 ,等于440是错的 2.然后Gemini验算了一遍,验算的结果是440 3.最后来了一句:所以结果确实是 440。 各位佬,你们的Gemini是不是这样啊 补充:开了Extended的模式之后 这回对味了 28 个
gemini这个幻觉把我吓哭了 让它把国际新闻汇总给我,胡言乱语了已经。 1 个帖子 - 1 位参与者 阅读完整话题
各种Spec,Harness用了个遍被各种幻觉折磨的不行,最后发现还是回归基本功比较好,用最基础的Plan+执行模式。目前正在构建下面这种工作流: 提案循环:提示词输入 → 生成方案 → 多个AI评审 → 人工评审 → 提示词输入…循环得到最终方案 执行和AI评审循环:执行 →
佬们,想问下ai幻觉问题怎么避免比较好,家里老人也用上豆包了,但是不知道ai幻觉这种问题,比如说还问豆包哪有修手表的地方这种问题,豆包说在商场地下室一层,结果是停车场,这种要怎么避免,不太懂现在的大模型,可以仿照那种视觉模型一样在提示词里加个置信度这种吗?还有豆包也不是很靠谱,像
prompt: 我的意思是说抽象的看,两者其实都是外挂啊,你拿Qwen3-ForcedAligner对标wav2vec2比架构先进性,就好比成人对标小孩 ,wav2vec2都是十几年前的了!!! 所以我说嘛,半斤八两,在现代各种范式架构成熟情况下,放条狗都能做出来,这有啥好夸的呢
这是一盒神奇巧克力,吃完有概率出现以下情况:提高工作效率、出现降智、幻觉、以及巧克力每周刷新一次 1 个帖子 - 1 位参与者 阅读完整话题
得益于 Antigravity CLi 的问世, Gemini CLI进入了坟墓, 而人们终于有机会用 agy -p 来调用 claude opus 4.6 而不怕被 Anthropic 封号. 但那不重要, 在很快的用完了我的 claude 5h 限额后, 我开始用 Gemin
Gemini网页版的搜索一直体验极差 幻觉极高 甚至一度怀疑前端根本没做搜索功能 Gemini App偶尔会显示在搜索,网页版从来都不会显示搜索 现在更新了新版UI 网页版终于会显示搜索了 然而。。 pro+新版web端 持续拒绝回答??? flash(或许是3.5或许是3)+新
5月19日,DeepSeek官方账号发布《关于 字符触发模型异常回复的说明》:近期,我们关注到有用户反馈,在与DeepSeek模型的对话中输入“ ”这类特殊字符后,模型偶发返回不可预期的内容,使部分用户产生了“对话泄露”的疑虑。针对这一问题,我们的技术团队经全面排查后,发现: 输
关于 近期,我们关注到有用户反馈,在与 DeepSeek 模型的对话中输入“”这类特殊字符后,模型偶发返回不可预期的内容,使部分用户产生了“对话泄露”的疑虑。针对这一问题,我们的技术团队经全面排查后发现: 输入“”等字符触发返回异常内容,属于特殊字符引发的模型幻觉,不涉及安全问题
IT之家 5 月 19 日消息,今日 DeepSeek 就“<think> 字符触发模型异常回复”发布说明,官方称:属于特殊字符引发的模型幻觉,不涉及安全问题或隐私泄露。 IT之家附声明全文如下: 关于 <think> 字符触发模型异常回复的说明 近期,我
看到佬们说是谷歌家出了新模型,急头白脸的去下了反重力,然后试了一下让新模型给我项目找bug,结果它告诉我一个我的项目中不存在的子工具。这是幻觉吗? 6 个帖子 - 3 位参与者 阅读完整话题
下午三点多发的。 其他领域的反馈,比如小说,公文,幻觉,搜索,代码等,也可以向小红书贴主陈小礼反馈,后续和同事同步。 小红书链接 小红书 - 你的生活兴趣社区 也可发送到邮箱 victorchen@deepseek.com 12 个帖子 - 8 位参与者 阅读完整话题
如图, 空会话输入<think, 看起来像是进入了谁的会话碎片? 原来是幻觉 7 个帖子 - 6 位参与者 阅读完整话题
看到大量讨论LLM幻觉但事先不知道是幻觉的帖子有感而发 Gemini和ChatGPT的回答最下面写着这么一行字,他这么写是有他的道理的 LLM是有幻觉的,尽管2026年了幻觉表面看起来已经很少了,但不代表它没有幻觉了 但是很多佬友经常忽视了这个前提 所以经常会疑惑然后发帖 比如经