来个LLM大手子解答一下

deepseekv4 pro是1.6T的MOE模型,如果改成稠密模型,效果能不能和御三家持平 2 个帖子 - 2 位参与者 阅读完整话题...
来个LLM大手子解答一下
来个LLM大手子解答一下

deepseekv4 pro是1.6T的MOE模型,如果改成稠密模型,效果能不能和御三家持平

2 个帖子 - 2 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文