Qwen 3.6 35B-A3B 智商测试,感觉还可以

Qwen 3.6 35B-A3B 智商测试 之前没考虑过本地部署 LLM——一是没卡没好设备,二是感觉小模型智商不会高到哪里去。 但最近对 Claude Opus 的降智略感失望,本地部署个不错的 LLM 至少不会降智。看佬儿友分享最近发布的 Qwen 3.6 ,看起来不错,手痒试了一下。一番调研后...
Qwen 3.6 35B-A3B 智商测试,感觉还可以
Qwen 3.6 35B-A3B 智商测试,感觉还可以

Qwen 3.6 35B-A3B 智商测试

之前没考虑过本地部署 LLM——一是没卡没好设备,二是感觉小模型智商不会高到哪里去。

但最近对 Claude Opus 的降智略感失望,本地部署个不错的 LLM 至少不会降智。看佬儿友分享最近发布的 Qwen 3.6,看起来不错,手痒试了一下。一番调研后选择了 MLX 的 Q8 量化,兼顾速度和精度。


1)比大小 / 洗车问题 / 色盲问题

表现不错,全部一次答对 :white_check_mark:

image

2)糖果问题

第一次答错了,第二次在提醒下答对了 :warning:

image


后续

明天继续测代码能力,以及其他小参数模型:

模型 量化 Gemma 4 31B Q8 Qwen 3.5 122B-A10B Q4 (应该是这台电脑的极限了)

环境 & 参数

设备:MBP M3 Max 128G
环境:LM Studio
量化:Q8_0
速度:60.87 tok/sec

temperature = 1.0
top_p = 0.95
top_k = 20
min_p = 0.0
repetition_penalty = 1.0

1 个帖子 - 1 位参与者

阅读完整话题

来源: linux.do查看原文