EPS - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第24页 - 钛刻科技

为何 deepseek-v4-flash 思考过程都是英文

工具不变，项目不变，换 GLM/MiniMax/qwen 思考过程都是中文，而 deepseek-v4-flash 思考过程都是英文。是不是因为 DeepSeek 蒸馏过程不用中文了？

tech V2EX - 技术 2026-05-11 23:18:16+08:00

为何 deepseek-v4-flash 思考过程都是英文

工具不变，项目不变，换 GLM/MiniMax/qwen 思考过程都是中文，而 deepseek-v4-flash 思考过程都是英文。是不是因为 DeepSeek 蒸馏过程不用中文了？

tech V2EX - 技术 2026-05-11 23:18:16+08:00

为何 deepseek-v4-flash 思考过程都是英文

工具不变，项目不变，换 GLM/MiniMax/qwen 思考过程都是中文，而 deepseek-v4-flash 思考过程都是英文。是不是因为 DeepSeek 蒸馏过程不用中文了？

tech V2EX - 技术 2026-05-11 23:18:16+08:00

为何 deepseek-v4-flash 思考过程都是英文

工具不变，项目不变，换 GLM/MiniMax/qwen 思考过程都是中文，而 deepseek-v4-flash 思考过程都是英文。是不是因为 DeepSeek 蒸馏过程不用中文了？

tech V2EX - 技术 2026-05-11 23:18:16+08:00

为何 deepseek-v4-flash 思考过程都是英文

工具不变，项目不变，换 GLM/MiniMax/qwen 思考过程都是中文，而 deepseek-v4-flash 思考过程都是英文。是不是因为 DeepSeek 蒸馏过程不用中文了？

tech V2EX - 技术 2026-05-11 23:18:16+08:00

为何 deepseek-v4-flash 思考过程都是英文

工具不变，项目不变，换 GLM/MiniMax/qwen 思考过程都是中文，而 deepseek-v4-flash 思考过程都是英文。是不是因为 DeepSeek 蒸馏过程不用中文了？

tech V2EX - 技术 2026-05-11 23:18:16+08:00

豆包真是飘了

豆包付费版本不是还没出吗，这几天经常性的“出了点问题，请稍后重试。”这开始学习deepseek了,有些许离谱，这几天把算力下调了吗 7 个帖子 - 7 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-11 21:34:02+08:00

请教一下 CPA 的多源轮询机制会不会显著降低缓存命中率？

比如我在 CPA 里给 deepseek-v4-pro 配置了多个上游 API 源。如果 CPA 在请求过程中不断轮询不同的 API provider，那么同一个长上下文会话是不是经常被发到不同的上游服务，导致服务端 prompt cache 不能稳定命中，这个理解对吗，向各位求

tech LinuxDo 最新话题 2026-05-11 20:09:30+08:00

视觉模型有没有推荐,测试deepseek/mimo都很差

cad出的图一个1.4m大小 300dpi 宽度 7016 高度 4961,deepseek/mimo效果完全不行. 用qwen3max /vl 都没有问题. 还有提前推荐的吗,我对比测试选一下 9 个帖子 - 8 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-11 19:38:07+08:00

我怎么感觉deepseekV4 flash比pro的花费更高？

最近一直在用deepseek，然后在做项目以及日常的工作中有种莫名奇妙的感觉，就是flash的消耗token量比pro的消耗量大，是我的错觉吗？ 3 个帖子 - 2 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-11 17:30:33+08:00

求助，ccswitch设置opencode go订阅的deepseek v4 pro 问题

{ “env”: { “ANTHROPIC_BASE_URL”: “ https://opencode.ai/zen/go/v1 ”, “ANTHROPIC_MODEL”: “deepseek-v4-pro”, “ANTHROPIC_DEFAULT_OPUS_MODEL”: “d

tech LinuxDo 最新话题 2026-05-11 17:19:45+08:00

究竟是deepseek还是chatgpt？

我记得我不是用的deepseek么，这个chatgpt是什么玩意儿 3 个帖子 - 3 位参与者阅读完整话题

tech LinuxDo 最新话题 2026-05-11 16:51:17+08:00

claude code + deepseek v4 pro 怎么这么慢？

之前使用的codex,现在换成 claude code + deepseek v4，怎么感觉生成代码特别慢。动不动就8分钟，往上。开发简单任务也是。下面是我的cc switch 配置 { "env": { "ANTHROPIC_BASE_URL&q

tech LinuxDo 最新话题 2026-05-11 15:36:16+08:00

当你只发送<think>给Deepseek时有几率已读乱回

RT，水群时亲友说发送 <think> 给ds会回复一个毫不相干的随机回答，于是我就去尝试了一下，是真的。以下所有对话均为新对话，没有任何上下文。使用的是网页版开启深度思考未开启联网搜索的专家模式第一次：已读乱回第二次：正常回复第三次：已读乱回第四次：已读乱

tech LinuxDo 最新话题 2026-05-11 15:29:47+08:00

破解加固新思路，deepseek出方案，让codex具体来执行

因为一些原因，我需要在模拟器上登录一个app，然后让codex帮我自动打卡，安装的时候发现总是闪退，我怀疑是app做了限制，一开始我让codex帮我去分析，但是codex总是拒绝，我就让deepseek来帮我分析，下载了一个opencode，配置了deepseek v4 pro

tech LinuxDo 最新话题 2026-05-11 14:38:01+08:00

deepseek-v4-pro、mimo、GPT5.5哪个模型好用一点

deepseek配置claude code链接：接入 Agent 工具 | DeepSeek API Docs mimo配置claude code链接: Xiaomi MiMo API Open Platform 大家使用哪个模型感觉好用一点，当前gpt plus额度有点不够用

tech LinuxDo 最新话题 2026-05-11 14:35:51+08:00

DeepSeekV4编码能力如何，能代替GPT5.5吗

我们公司ALL IN AI，但是不给Token，现在GPT也难薅了，但是我们公司的DeepSeek接口我可以反代出来自己用，里面最好的就是DeepSeek V4和GLM 5了没有5.1。所以有人实践过不，DeepSeek V4编码如何 16 个帖子 - 13 位参与者阅读完整

tech LinuxDo 最新话题 2026-05-11 14:22:21+08:00

有 V 友尝试 DeepSeek-TUI 那个项目吗？效果怎么样？

简单来说就是一个专门为 DeepSeek 做的 CC/Codex 项目地址： https://github.com/Hmbown/DeepSeek-TUI 以及，很有节目效果的作者推文 https://x.com/goodhunt/status/20500441276564890

tech V2EX - 技术 2026-05-11 14:08:20+08:00

有 V 友尝试 DeepSeek-TUI 那个项目吗？效果怎么样？

简单来说就是一个专门为 DeepSeek 做的 CC/Codex 项目地址： https://github.com/Hmbown/DeepSeek-TUI 以及，很有节目效果的作者推文 https://x.com/goodhunt/status/20500441276564890

tech V2EX - 技术 2026-05-11 13:49:44+08:00

传DeepSeek首轮500亿融资落定：阿里、腾讯、大基金各注百亿！

传 DeepSeek 首轮 500 亿人民币融资已接近落定。本轮由阿里、腾讯和国家大基金各注资 100 亿，加上创始人梁文锋个人的 200 亿组成，公司估值约为 3500 亿人民币。传闻华为也参与了投资谈判，而常规的顶级 VC 和 PE 则未能拿到入场券。开启外部融资直接缓解了

tech LinuxDo 最新话题 2026-05-11 12:16:51+08:00

EPS - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第24页 - 钛刻科技 | TCTI.cn

相关标签