又重度用了几天,DeepSeekV4的幻觉问题还是要注意

使用环境:deepseek官方接口+最新版OpenCode DeepSeekV4 pro-max(以下简称v4)的上下文能力,阅读能力,简单的推理理解能力毋庸置疑。但是最近重度用了一阵子发现,就算和kimi比,v4还是存在幻觉问题。 举个例子,我让agent去读取我的大论文并扩写10%,kimi会来...
又重度用了几天,DeepSeekV4的幻觉问题还是要注意
又重度用了几天,DeepSeekV4的幻觉问题还是要注意

使用环境:deepseek官方接口+最新版OpenCode

DeepSeekV4 pro-max(以下简称v4)的上下文能力,阅读能力,简单的推理理解能力毋庸置疑。但是最近重度用了一阵子发现,就算和kimi比,v4还是存在幻觉问题。

举个例子,我让agent去读取我的大论文并扩写10%,kimi会来回写一些车轱辘话分析的话来凑字数,v4直接开始编数据编结论 :distorted_face:但要是说遣词造句,表达水平确实还是v4更胜一筹。

所以我现在使用v4都是会使用kimi对git diff进行二次监督修正,保证幻觉不会耽误正事。

2 个帖子 - 2 位参与者

阅读完整话题

来源: linux.do查看原文