如题,wsl 配 rocm 下,sglang 没跑起来,vllm 跑起来了,但是动不动爆显存,只有跑个 2b 的模型才比较稳定,而且推理首字速度体感感觉比纯用 transformer 还慢。
transformer 我试了可以成功跑个 9b 的 gptq 模型(vllm 这个模型跑不成功报错 qwen3.5 什么 config 有问题,claudecode 修不了),是我不会用 vllm 还是消费级显卡就是不适合用这类推理框架?
如题,wsl 配 rocm 下,sglang 没跑起来,vllm 跑起来了,但是动不动爆显存,只有跑个 2b 的模型才比较稳定,而且推理首字速度体感感觉比纯用 transformer 还慢。
transformer 我试了可以成功跑个 9b 的 gptq 模型(vllm 这个模型跑不成功报错 qwen3.5 什么 config 有问题,claudecode 修不了),是我不会用 vllm 还是消费级显卡就是不适合用这类推理框架?
老友们,求分享分享啊,有什么讲得比较好的吗?最好是前端语言写的 1 个帖子 - 1 位参与者 阅读完整话题...
kiro-go导出的,不知道能不能用,后缀txt改成json kiro-accounts-2026-05-31.txt ...
一个 Project 当内容很多之后就特别卡,客户端或者第三方 App 能解决这种问题吗?...
之前开了一个kiro pro 因为手里没有固定ip 用机场怕封了 就没用 马上要过期了 分享给大家了 因为这个githu...
正文 记工时这件事,我一直很抗拒。 不是不想记,是 太麻烦 :下班路上脑子里还在复盘今天干了啥,回家打开表格或 App ...
IT之家 5 月 31 日消息,据央视新闻 5 月 30 日报道,记者从多家航空公司了解到,自 2026 年 6 月 5...
延展页面 · zhizhu.xiuhua.work
延展页面 · www.tcti.cn
延展页面 · www.gxxszb.com
延展页面 · www.aizhushou.shop
延展页面 · zhizhu.xiuhua.work
延展页面 · www.gxxszb.com
延展页面 · www.tcti.cn
延展页面 · zhizhu.xiuhua.work
延展页面 · www.gxxszb.com
延展页面 · zhizhu.xiuhua.work
延展页面 · www.aizhushou.shop
延展页面 · www.gxxszb.com
延展页面 · zhizhu.xiuhua.work
延展页面 · www.gxxszb.com
延展页面 · www.aizhushou.shop
延展页面 · www.tcti.cn
延展页面 · zhizhu.xiuhua.work
延展页面 · www.aizhushou.shop
延展页面 · www.gxxszb.com
延展页面 · zhizhu.xiuhua.work
延展页面 · www.gxxszb.com
延展页面 · zhizhu.xiuhua.work
延展页面 · www.gxxszb.com
延展页面 · zhizhu.xiuhua.work
延展页面 · www.gxxszb.com
延展页面 · zhizhu.xiuhua.work
延展页面 · www.tcti.cn
延展页面 · www.aizhushou.shop
延展页面 · www.gxxszb.com
延展页面 · zhizhu.xiuhua.work