如题,wsl 配 rocm 下,sglang 没跑起来,vllm 跑起来了,但是动不动爆显存,只有跑个 2b 的模型才比较稳定,而且推理首字速度体感感觉比纯用 transformer 还慢。
transformer 我试了可以成功跑个 9b 的 gptq 模型(vllm 这个模型跑不成功报错 qwen3.5 什么 config 有问题,claudecode 修不了),是我不会用 vllm 还是消费级显卡就是不适合用这类推理框架?
如题,wsl 配 rocm 下,sglang 没跑起来,vllm 跑起来了,但是动不动爆显存,只有跑个 2b 的模型才比较稳定,而且推理首字速度体感感觉比纯用 transformer 还慢。
transformer 我试了可以成功跑个 9b 的 gptq 模型(vllm 这个模型跑不成功报错 qwen3.5 什么 config 有问题,claudecode 修不了),是我不会用 vllm 还是消费级显卡就是不适合用这类推理框架?
deadline要靠近了,然后出去玩也玩不好, 现在逼自己坐电脑前内耗. 1 个帖子 - 1 位参与者 阅读完整话题...
现在是终审第2天了(或者可能是第3天),流程图上说是7天内就会给结果。现在每天看2遍,上午看一遍,下午看一遍,看的人都焦...
从 4 月 16 日到今天( 2026 年 5 月 30 日),一共是 44 天 以上是我 vibe coding 的访...
题主在公司里是做post train infra,也做一点算法,codex 重度用户,自己电脑上是20x pro平常做点...
plus全拉闸了,就剩一个反重力了,不给我逆。一天不逆向浑身难受 1 个帖子 - 1 位参与者 阅读完整话题...
秀一秀 https://show1show.com 花了大半天时间 vibe coding 出来的,欢迎大家提出宝贵的意...
延展页面 · zhizhu.xiuhua.work
延展页面 · www.tcti.cn
延展页面 · www.gxxszb.com
延展页面 · zhizhu.xiuhua.work
延展页面 · www.gxxszb.com
延展页面 · zhizhu.xiuhua.work
延展页面 · www.aizhushou.shop
延展页面 · www.gxxszb.com
延展页面 · zhizhu.xiuhua.work
延展页面 · www.tcti.cn
延展页面 · www.gxxszb.com
延展页面 · zhizhu.xiuhua.work
延展页面 · www.gxxszb.com
延展页面 · zhizhu.xiuhua.work
延展页面 · www.gxxszb.com
延展页面 · zhizhu.xiuhua.work
延展页面 · www.gxxszb.com
延展页面 · zhizhu.xiuhua.work
延展页面 · www.gxxszb.com
延展页面 · www.aizhushou.shop
延展页面 · www.tcti.cn
延展页面 · zhizhu.xiuhua.work
延展页面 · www.aizhushou.shop
延展页面 · www.gxxszb.com
延展页面 · zhizhu.xiuhua.work
延展页面 · www.gxxszb.com
延展页面 · zhizhu.xiuhua.work
延展页面 · www.gxxszb.com
延展页面 · zhizhu.xiuhua.work
延展页面 · www.gxxszb.com