大语言模型蒸馏时 学生模型仍可能继承教师模型的偏好

https://www.nature.com/articles/s41586-026-10319-8 1 个帖子 - 1 位参与者 阅读完整话题...
大语言模型蒸馏时 学生模型仍可能继承教师模型的偏好
大语言模型蒸馏时 学生模型仍可能继承教师模型的偏好

image
image
https://www.nature.com/articles/s41586-026-10319-8

1 个帖子 - 1 位参与者

阅读完整话题

来源: linux.do查看原文