Deepseek在今天下午故障1小时后,似乎首字延迟和响应速度更快了。

结论: DS扩卡了 数据来部门内部New-api,接入Deepseek官方API,所有统计均限为Deepseek-v4-pro模型 Token生成速度未变化, 33.4tok/s vs 33.7tok/s 缓存命中率 97.9% vs 98.6% 响应时间降低约 40% ~ 50% 首字延迟降低约 ...
Deepseek在今天下午故障1小时后,似乎首字延迟和响应速度更快了。
Deepseek在今天下午故障1小时后,似乎首字延迟和响应速度更快了。

结论: DS扩卡了

数据来部门内部New-api,接入Deepseek官方API,所有统计均限为Deepseek-v4-pro模型

  1. Token生成速度未变化,33.4tok/s vs 33.7tok/s
  2. 缓存命中率 97.9% vs 98.6%
  3. 响应时间降低约 40% ~ 50%
  4. 首字延迟降低约 56% ~ 76%

以下为使用Deepseek V4 Pro max调用newapi数据库进行的分析。

在无缓输入、缓存命中输入、输出均增加的情况下,响应和延迟还大幅优化了。

图片

图片

图片

6 个帖子 - 4 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文