为何 deepseek-v4-flash 思考过程都是英文
工具不变,项目不变,换 GLM/MiniMax/qwen 思考过程都是中文,而 deepseek-v4-flash 思考过程都是英文。是不是因为 DeepSeek 蒸馏过程不用中文了?
EPS - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第24页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 2066 篇相关文章 · 第 24 / 104 页
工具不变,项目不变,换 GLM/MiniMax/qwen 思考过程都是中文,而 deepseek-v4-flash 思考过程都是英文。是不是因为 DeepSeek 蒸馏过程不用中文了?
工具不变,项目不变,换 GLM/MiniMax/qwen 思考过程都是中文,而 deepseek-v4-flash 思考过程都是英文。是不是因为 DeepSeek 蒸馏过程不用中文了?
工具不变,项目不变,换 GLM/MiniMax/qwen 思考过程都是中文,而 deepseek-v4-flash 思考过程都是英文。是不是因为 DeepSeek 蒸馏过程不用中文了?
工具不变,项目不变,换 GLM/MiniMax/qwen 思考过程都是中文,而 deepseek-v4-flash 思考过程都是英文。是不是因为 DeepSeek 蒸馏过程不用中文了?
工具不变,项目不变,换 GLM/MiniMax/qwen 思考过程都是中文,而 deepseek-v4-flash 思考过程都是英文。是不是因为 DeepSeek 蒸馏过程不用中文了?
工具不变,项目不变,换 GLM/MiniMax/qwen 思考过程都是中文,而 deepseek-v4-flash 思考过程都是英文。是不是因为 DeepSeek 蒸馏过程不用中文了?
豆包付费版本不是还没出吗,这几天经常性的“出了点问题,请稍后重试。”这开始学习deepseek了,有些许离谱,这几天把算力下调了吗 7 个帖子 - 7 位参与者 阅读完整话题
比如我在 CPA 里给 deepseek-v4-pro 配置了多个上游 API 源。如果 CPA 在请求过程中不断轮询不同的 API provider,那么同一个长上下文会话是不是经常被发到不同的上游服务,导致服务端 prompt cache 不能稳定命中,这个理解对吗,向各位求
cad出的图 一个1.4m大小 300dpi 宽度 7016 高度 4961,deepseek/mimo效果完全不行. 用qwen3max /vl 都没有问题. 还有提前推荐的吗,我对比测试选一下 9 个帖子 - 8 位参与者 阅读完整话题
最近一直在用deepseek,然后在做项目以及日常的工作中有种莫名奇妙的感觉,就是flash的消耗token量比pro的消耗量大,是我的错觉吗? 3 个帖子 - 2 位参与者 阅读完整话题
{ “env”: { “ANTHROPIC_BASE_URL”: “ https://opencode.ai/zen/go/v1 ”, “ANTHROPIC_MODEL”: “deepseek-v4-pro”, “ANTHROPIC_DEFAULT_OPUS_MODEL”: “d
我记得我不是用的deepseek么,这个chatgpt是什么玩意儿 3 个帖子 - 3 位参与者 阅读完整话题
之前使用的codex,现在换成 claude code + deepseek v4,怎么感觉生成代码特别慢。动不动就8分钟,往上。开发简单任务也是。 下面是我的cc switch 配置 { "env": { "ANTHROPIC_BASE_URL&q
RT,水群时亲友说发送 <think> 给ds会回复一个毫不相干的随机回答,于是我就去尝试了一下,是真的。 以下所有对话均为新对话,没有任何上下文。使用的是网页版开启深度思考未开启联网搜索的专家模式 第一次:已读乱回 第二次:正常回复 第三次:已读乱回 第四次:已读乱
因为一些原因,我需要在模拟器上登录一个app,然后让codex帮我自动打卡,安装的时候发现总是闪退,我怀疑是app做了限制,一开始我让codex帮我去分析,但是codex总是拒绝,我就让deepseek来帮我分析,下载了一个opencode,配置了deepseek v4 pro
deepseek配置claude code链接: 接入 Agent 工具 | DeepSeek API Docs mimo配置claude code链接: Xiaomi MiMo API Open Platform 大家使用哪个模型感觉好用一点,当前gpt plus额度有点不够用
我们公司ALL IN AI,但是不给Token,现在GPT也难薅了,但是我们公司的DeepSeek接口我可以反代出来自己用,里面最好的就是DeepSeek V4和GLM 5了 没有5.1。所以有人实践过不,DeepSeek V4编码如何 16 个帖子 - 13 位参与者 阅读完整
简单来说就是一个专门为 DeepSeek 做的 CC/Codex 项目地址: https://github.com/Hmbown/DeepSeek-TUI 以及,很有节目效果的作者推文 https://x.com/goodhunt/status/20500441276564890
简单来说就是一个专门为 DeepSeek 做的 CC/Codex 项目地址: https://github.com/Hmbown/DeepSeek-TUI 以及,很有节目效果的作者推文 https://x.com/goodhunt/status/20500441276564890
传 DeepSeek 首轮 500 亿人民币融资已接近落定。本轮由阿里、腾讯和国家大基金各注资 100 亿,加上创始人梁文锋个人的 200 亿组成,公司估值约为 3500 亿人民币。传闻华为也参与了投资谈判,而常规的顶级 VC 和 PE 则未能拿到入场券。 开启外部融资直接缓解了