有人知道nvfp4这种量化格式该怎么改吗?

我是50系显卡,听说了nvfp4格式的量化模型能最大程度上利用显卡的算力,想尝试一下,但是在魔塔跟huggingface都没有找到现成的模型,想自己量化又不知道该怎么做,问大模型也是各说各的方式 1 个帖子 - 1 位参与者 阅读完整话题...
有人知道nvfp4这种量化格式该怎么改吗?
有人知道nvfp4这种量化格式该怎么改吗?

我是50系显卡,听说了nvfp4格式的量化模型能最大程度上利用显卡的算力,想尝试一下,但是在魔塔跟huggingface都没有找到现成的模型,想自己量化又不知道该怎么做,问大模型也是各说各的方式

1 个帖子 - 1 位参与者

阅读完整话题

来源: linux.do查看原文