怎么感觉deepseek-v4-pro max在超过400k上下文时,注意力机制缺陷很大?

一个重构项目,多终端一直卡着无法debug完成,表现为ABCDE五个终端,所有输入都只会错误的输入到A终端,且经过多轮debug无法解决。 当从300K上下文Debug到400K上下文时,v4 pro max开始每轮对话添加一个小修复和日志埋点让我测试运行。然后 加埋点→收集日志→测试运行→加埋点 ...
怎么感觉deepseek-v4-pro max在超过400k上下文时,注意力机制缺陷很大?
怎么感觉deepseek-v4-pro max在超过400k上下文时,注意力机制缺陷很大?

图片

图片

一个重构项目,多终端一直卡着无法debug完成,表现为ABCDE五个终端,所有输入都只会错误的输入到A终端,且经过多轮debug无法解决。
当从300K上下文Debug到400K上下文时,v4 pro max开始每轮对话添加一个小修复和日志埋点让我测试运行。然后加埋点→收集日志→测试运行→加埋点 不断重复。

  • OMO所有Agent全部设置为deepseek-v4-pro max思考。
  • deepseek-v4-pro渠道为opencode go,应该不存在降智问题。

4 个帖子 - 4 位参与者

阅读完整话题

来源: linux.do查看原文