基于16张910B4可以部署哪些比较好的大模型用来ai coding

公司要内网开发,需要部署一个 AI Coding 大模型,有 16 张昇腾 910B4 的卡。我之前没用过昇腾,想请教一下:基于这 16 张卡,有哪些开发效果比较好的模型(比如 deepseek v4、glm5.1、qwen系列等)推荐?一般需要多少张 910B4 能跑得比较舒服?部署量化版本的模型...
基于16张910B4可以部署哪些比较好的大模型用来ai coding
基于16张910B4可以部署哪些比较好的大模型用来ai coding

公司要内网开发,需要部署一个 AI Coding 大模型,有 16 张昇腾 910B4 的卡。我之前没用过昇腾,想请教一下:基于16 张卡,有哪些开发效果比较好的模型(比如 deepseek v4、glm5.1、qwen系列等)推荐?一般需要多少张 910B4 能跑得比较舒服?部署量化版本的模型效果是不是不太好,那部署原始权重的模型(没量化)16张卡够用吗?晟腾卡上部署大模型在软件/框架上有什么要求吗?谢谢各位佬解答!

6 个帖子 - 4 位参与者

阅读完整话题

来源: linux.do查看原文