关于 deepseek-v4 的几点讨论...

感觉 deepseek 选择某为的卡做推理算是真的亏大了,不说拉了坨大了,起码也是完全不符合预期。 一堆人还搁那狂吹… 几个疑惑 or 痛点如下: 官方原话为“体验优于 Sonnet4.5,却弱于 Opus4.6 思考模式”,但是为啥不对比 Opus4.5?根据大佬“大模型观测员”的测评,明显编程上...
关于 deepseek-v4 的几点讨论...
关于 deepseek-v4 的几点讨论...

感觉 deepseek 选择某为的卡做推理算是真的亏大了,不说拉了坨大了,起码也是完全不符合预期。
一堆人还搁那狂吹…
几个疑惑 or 痛点如下:

  • 官方原话为“体验优于 Sonnet4.5,却弱于 Opus4.6 思考模式”,但是为啥不对比 Opus4.5?根据大佬“大模型观测员”的测评,明显编程上是弱于 Opus4.5 的,而且文章里还暗戳戳的用了 16 字成语装了个小逼,是否有些“怪怪的”?
  • 没有 Agent 特化,跑分和 claude code 等终端使用存在差距(看到过内测群消息,真实性待验证)
  • 没有多模态(这点最拉了,北美御三家都有)
  • 周期性,有传言应该是 2 月份发布,但如今拖到 4 月底,而如今 gpt 和 claude 已经进入到 5.5和 4.7时代,内部估计进入到了 5.6和 4.7+(水豚)的版本,而 deepseek 还在期待下半年的卡,是否意味着其是刚刚赶鸭子上架 deepseek-v4,刚开始或者还没开始 v5?这样一比,大致落后了接近 3 个版本了,而且目前来看,deepseek 还比不上 glm。

1 个帖子 - 1 位参与者

阅读完整话题

来源: linux.do查看原文