『LDML』关于L站大模型排行榜,求各位佬友支点招!

主帖链接: 『LDML主贴』用于讨论评价大模型能力的排行榜网站!! ↑↑↑关于本站的具体情况,请点击上方主帖查看详情↑↑↑ 情况 LDML大模型排行榜站已经开了一周了。前两天我们上新了几个新的模型,但是却没人来投票,导致根本没有数据来做排行榜。刚上的更新帖子还没几个人看就被L站的大数据刷下去了。然后...
『LDML』关于L站大模型排行榜,求各位佬友支点招!
『LDML』关于L站大模型排行榜,求各位佬友支点招!

主帖链接:『LDML主贴』用于讨论评价大模型能力的排行榜网站!!

↑↑↑关于本站的具体情况,请点击上方主帖查看详情↑↑↑

情况

LDML大模型排行榜站已经开了一周了。前两天我们上新了几个新的模型,但是却没人来投票,导致根本没有数据来做排行榜。刚上的更新帖子还没几个人看就被L站的大数据刷下去了。然后我看到半年前也有人提出了”L站专属大模型榜单“的概念 跳转帖子:Linux do专属大模型榜单,当时呼声很高,但是至今没有实现。针对他的一些想法我认为可以吸收并加以改良。现在就LDML站的情况,求各位佬友来指导指导建议。

一些提案

  1. 鉴于LDML站的引流纯靠L站帖子,我考虑制作一个活动区,时不时展出几个大模型的输出对比,让佬友们进行投票与讨论,来决出胜者,同时计入活动区的记录中,以供全局参考。
  2. 针对QQbot佬友的概念,LDML站可以推出一个题库栏,由佬友们来上传题库,我们时不时会进对大部分模型进行测试,来得出一个客观的排行榜。这个题库我们不会进行公示,仅用作LDML模型的测试用途。
  3. 发放一些抽奖红包用于引流,为本站排行榜做出贡献,即可参与投票

需要解决的问题

  1. 站内数据十分贫瘠,这一周仅注册了100位左右的用户,参与投票的仅不到20人,这样的数据量完全不足以支撑排行榜的可靠性
  2. 针对QQbot佬友的概念,我们会支出不少token用于测试大模型,我坚持认为公益站不应与钱扯上关系。那么这部分支出只能由我一人承担,我在考虑有无必要开放类似于”爱发电“这种投喂方式。以及是否有违社区的规则和建站的初衷。
  3. 针对QQbot佬友的概念,其中提到关于专家组的建设,这是一个很难抉择的问题。作为一个社区排行榜,理应让社区内所有成员都有平等参与的机会,专家组的申请和通过是否设立门槛,门槛多高,这很难确定。我不希望这个排行榜最后成为”小团体“的片面见解。

欢迎各位佬友在评论区提出建议和见解,为我们LDML站献上一份力!!!感谢各位!!!

6 个帖子 - 4 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文