结论: DS扩卡了
数据来部门内部New-api,接入Deepseek官方API,所有统计均限为Deepseek-v4-pro模型
- Token生成速度未变化,33.4tok/s vs 33.7tok/s
- 缓存命中率 97.9% vs 98.6%
- 响应时间降低约 40% ~ 50%
- 首字延迟降低约 56% ~ 76%
以下为使用Deepseek V4 Pro max调用newapi数据库进行的分析。
在无缓输入、缓存命中输入、输出均增加的情况下,响应和延迟还大幅优化了。
6 个帖子 - 4 位参与者