【开源】做了个中转站模型批量测试工具,解决「不知道哪些模型能用以及支不支持工具调用」的问题

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社...
【开源】做了个中转站模型批量测试工具,解决「不知道哪些模型能用以及支不支持工具调用」的问题
【开源】做了个中转站模型批量测试工具,解决「不知道哪些模型能用以及支不支持工具调用」的问题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
  • 我的帖子已经打上 开源推广 标签:
  • 我的开源项目完整开源,无未开源部分:
  • 我的开源项目已链接认可 LINUX DO 社区:
  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
  • 以上选择我承诺是永久有效的,接受社区和佬友监督:

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出


用了好几个中转站之后,发现一个共同的痛点:就是站里有哪些模型可以用、哪些支持工具调用,完全看不出来,只能一个个试。
所以做了这个:
模型测试器 — 把你的中转站地址和 Key 填进去,自动帮你:
1 拉取所有可用模型列表
2 批量测试聊天能力(流式响应、TTFT、延迟、Token 用量)
3 批量测试工具调用能力(Function Calling,支持强制调用 → 自动回退)
支持同时配置多个渠道对比,并发数可调(1/3/5/10)。

image

纯静态页面,不需要后端,不需要安装,浏览器直接打开:
在线体验:https://yuanzhi-yw.github.io/model-tester/

开源地址:https://github.com/yuanzhi-yw/model-tester

2 个帖子 - 2 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文