[人工智能] Qwen3.6 MTP GGUF 发布：本地推理 1.4-2.2 倍加速

编辑部 2026-05-19T12:18:47.452432 30148 阅读 tech

Unsloth 团队为 Qwen3.6 发布了 MTP （ Multi Token Prediction ） GGUF 量化版本，可 Qwen3.6 的本地推理速度提升 1.4-2.2 倍，精度无任何损失。除 Qwen3.6 外，Unsloth 这次还回溯发布了 Qwen3.5 系列的 MTP G...

Unsloth 团队为 Qwen3.6 发布了 MTP （ Multi Token Prediction ） GGUF 量化版本，可 Qwen3.6 的本地推理速度提升 1.4-2.2 倍，精度无任何损失。

Qwen3.6 MTP GGUF

除 Qwen3.6 外，Unsloth 这次还回溯发布了 Qwen3.5 系列的 MTP GGUF ，覆盖 0.8B 、2B 、4B 、9B 、27B 、35B-A3B 、122B-A10B 、397B-A17B 全家族。这意味着已经在用 Qwen3.5 系列做本地推理的开发者可以直接迁到 MTP 版本而不换模型。

原文：Qwen3.6 MTP GGUF 发布：本地推理 1.4-2.2 倍加速，精度无损

来源: v2ex查看原文

[人工智能] Qwen3.6 MTP GGUF 发布：本地推理 1.4-2.2 倍加速

[汽车] 车里进蚊子了怎么都赶不走，有没有什么妙招？

[随想] 对于目前的关于 ai 的看法和感受

相关推荐