为何 deepseek-v4-flash 思考过程都是英文

工具不变,项目不变,换 GLM/MiniMax/qwen 思考过程都是中文,而 deepseek-v4-flash 思考过程都是英文。是不是因为 DeepSeek 蒸馏过程不用中文了?...
为何 deepseek-v4-flash 思考过程都是英文
为何 deepseek-v4-flash 思考过程都是英文

工具不变,项目不变,换 GLM/MiniMax/qwen 思考过程都是中文,而 deepseek-v4-flash 思考过程都是英文。是不是因为 DeepSeek 蒸馏过程不用中文了?

来源: V2EX - 技术查看原文