grok2api新模型测试

因为grok2api主分支迟迟不更新,发现已经有大佬fork并支持了最新的4.3模型了。 项目分支是: GitHub - cloudriver8/grok2api at feat/console-x-ai-routing · GitHub 我是直接让codex将老版本直接改成分支的,具体干了啥我也不...
grok2api新模型测试
grok2api新模型测试

因为grok2api主分支迟迟不更新,发现已经有大佬fork并支持了最新的4.3模型了。
项目分支是:GitHub - cloudriver8/grok2api at feat/console-x-ai-routing · GitHub
我是直接让codex将老版本直接改成分支的,具体干了啥我也不知道。
我的都是free号,当前对外可见模型
这些是 /v1/models 当前返回的 9 个模型,全部实测可用:

模型 类型 结果 耗时 grok-4.20-0309-non-reasoning chat 可用 2.53s grok-4.20-fast chat 可用 0.96s grok-4.3 chat 可用 2.62s grok-4 chat 可用 2.61s grok-4.20 chat 可用 1.39s grok-4.20-reasoning chat 可用 3.02s grok-4.20-non-reasoning chat 可用 0.66s grok-4.20-multi-agent chat 可用 3.50s grok-imagine-image-lite image 可用 15.96s

当前不可见/不可测模型
项目注册表里还有这些模型,但当前账号池只有 basic active 25647,没有 super/heavy 账号池,所以 /v1/models 不暴露它们,本次没有按可用模型测试:

grok-4.20-0309
grok-4.20-0309-reasoning
grok-4.20-0309-non-reasoning-super
grok-4.20-0309-super
grok-4.20-0309-reasoning-super
grok-4.20-0309-non-reasoning-heavy
grok-4.20-0309-heavy
grok-4.20-0309-reasoning-heavy
grok-4.20-multi-agent-0309
grok-4.20-auto
grok-4.20-expert
grok-4.20-heavy
grok-4.3-beta
grok-imagine-image
grok-imagine-image-pro
grok-imagine-image-edit
grok-imagine-video

修复点:grok-4.20 原本会被自动注入上游不支持的 reasoningEffort=high,导致 400。我已在 app/control/model/registry.py 去掉该默认参数,重建并部署后复测通过。

在当前可用的 9 个模型里,优先级可以这样看:

  1. grok-4.20-multi-agent
     通常最强,适合复杂推理、检索、多步骤分析、需要更稳答案的任务。
  2. grok-4.20-reasoning
     推理型模型,适合代码分析、数学、规划、长链路判断。比普通 grok-4.20 更适合需要“想清楚”的任务。
  3. grok-4.3 / grok-4 / grok-4.20
     通用能力强,适合日常问答、写作、代码、总结。grok-4.3 理论上更新,优先试它。
  4. grok-4.20-fast / grok-4.20-non-reasoning / grok-4.20-0309-non-reasoning
     更偏速度和普通对话,不适合复杂推理。
  5. grok-imagine-image-lite
     图片生成模型,不和文本模型直接比较。

  我的建议:默认用 grok-4.20-multi-agent;如果它慢或不稳定,用 grok-4.20-reasoning;日常快速任务用 grok-4.3 或 grok-4.20-fast。
| 模型 | MCP 搜索表现 |
  |---|---|
  | grok-4.3 | 最均衡,约 55s,返回 27 个 sources,答案长度适中 |
  | grok-4.20-reasoning | 可用,约 58s,返回 23 个 sources,但更慢一点 |
  | grok-4.20-multi-agent | 可用,约 55s,返回 19 个 sources,但 token 消耗极高,日志里一次到 213945 tokens,不适合作为 MCP 默认搜索模型 |
  | grok-4.20 | 不稳定,出现过 60s 上游超时 |
  | grok-4.20-fast | 当前默认,但不适合 MCP 搜索;容易无有效搜索来源或 fallback |
  | non-reasoning 系列 | 更适合普通快速回答,不适合作为搜索汇总模型 |

13 个帖子 - 9 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文