求解 本地自部署Qwen3.6-27B,vllm启动,思考中断

有个很恶心的问题,显存和内存CPU都没有爆的情况下,他会自己中断思考。日志里面看不到任何报错信息。使用vllm启动的,只有- 聊天:POST /v1/chat/completions - 文本续写:POST /v1/completions 这两个接口。很奇怪的是,改代码的时候很少会中断,但是他输出要...
求解 本地自部署Qwen3.6-27B,vllm启动,思考中断
求解 本地部署Qwen3.6-27B,vllm启动,思考中断

有个很恶心的问题,显存和内存CPU都没有爆的情况下,他会自己中断思考。日志里面看不到任何报错信息。使用vllm启动的,只有- 聊天:POST /v1/chat/completions - 文本续写:POST /v1/completions 这两个接口。很奇怪的是,改代码的时候很少会中断,但是他输出要扫描代码或者文件之后,就很容易断

5 个帖子 - 3 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文