小白写,小白看的常见主流模型分类

发文是因为本编程小白在L站蹭了很多公益站,半摸瞎地搞了一些小工具。但是很多时候因为对各个模型不够了解,无脑选gpt的模型,想想有些简单功能或许用不上牛刀,感觉有些浪费。所以做一个整理,方便跟我一样的小白对模型有个大概的了解,在选择模型时稍微有些方向。 此文用词不会专业(能力受限),只是一位行外人很浅...
小白写,小白看的常见主流模型分类
小白写,小白看的常见主流模型分类

发文是因为本编程小白在L站蹭了很多公益站,半摸瞎地搞了一些小工具。但是很多时候因为对各个模型不够了解,无脑选gpt的模型,想想有些简单功能或许用不上牛刀,感觉有些浪费。所以做一个整理,方便跟我一样的小白对模型有个大概的了解,在选择模型时稍微有些方向。

此文用词不会专业(能力受限),只是一位行外人很浅层的理解,因为初衷其实是我想看懂这些没有被统一度量衡的模型 :joy:。表达或理解有误之处欢迎指正。

通用含义:

Pro/Max/Expert,thinking/reasoner/reasoning/r-能力最强,思考时间长,也最贵,适合复杂任务;
Plus-效果平衡;
mini/Flash/Fast/Lite/air-适合简单任务,速度快;
nano-最小模型,处理及其简单的拼写、分类等轻量任务;
Coder/Codex/Code-工具调用,环境交互,编程用;
VL-视觉理解,文本外还可输入图像及视频;
Omni-全模态,文图音视;
instruct/chat-对话聊天;
preview-抢先版,最新,但可能不稳定;
oss- Open Source Software,开源模型
search/web-具备联网搜索能力


通用协议:

  • completions
    • 出品方:openai
    • 最古典、最通用、最主流的 llm 对话调用接口标准
  • messages
    • 出品方:anthropic
    • 首个和 openai 分庭抗礼的角色,就是要和 openai 不一样,尽管刚开始的时候接口字段相当接近,A\ 仍然选择搞一个独特的路由接口标准,但是现在又悄咪咪兼容了 completions 接口,claude code 大大提高了 messages 接口的流行度
  • responses
    • 出品方:openai
    • openai 推行的面向 agent 的下一代 api 标准,内置工具、提供有状态上下文,Codex 专属接口,chat 转 codex 可使用 cpa 等工具,且性能可能有损失
  • X
    • 烂中烂,包括但不限于 Google 等厂商把模型、api 参数嵌入 url 中的各种奇形怪状标准

以下模型分类来自我在用的各个公益站的模型广场,列出的是最新的一些模型,信息来源为参考网站:

国外部分:

  • 1、Open AI
    我想在座的各位无人不识Chatgpt:https://openai.com/api/
    gpt-5.5,最新模型,处理最复杂的工作;
    gpt-5.3-Codex,擅长agentic tasks,质量平衡,处理复杂开发任务;
    gpt-5-mini,适合大多数编码
    支持协议:completions,responses

  • 2、Claude
    Anthropic公司: Plans & Pricing | Claude by Anthropic
    claude-haiku-4-5-20251001,速度最快,轻量模型
    claude-sonnet-4-6,体量适中,最平衡
    claude-opus-4-7,处理最复杂逻辑推理
    支持协议:messages,completions

  • 3、Grok
    马斯克旗下xAI: Models and Pricing | xAI Docs
    (除了图视音,官方强烈建议都用grok-4.3)
    grok-4.3
    grok-4.20-0309-reasoning
    grok-4.20-0309-non-reasoning
    支持协议:copmpletions,responses

  • 4、Gemini
    谷歌:https://ai.google.dev/gemini-api/docs/models
    Gemini-3.1-Pro
    Gemini-3-Flash
    Gemini-3.1-Flash-Lite
    支持协议:x,completions

国内部分:

  • 1、Kimi
    月之暗面: 模型列表 - Kimi API 开放平台
    kimi-k2.6,coding模型,具备长程编码能力
    moonshot-v1,简单文字任务
    支持协议:completions,messages

  • 2、Qwen
    阿里巴巴:通义实验室 | Qwen
    B- Billion,前面数字越大,代表参数量越大,能力越强,越耗费算力。
    例:小参数(8B,14B);中等参数(32B,72B);大型参数(110B)
    Embedding-嵌入模型,非直接对话,目的是把输入内容转为计算机能理解的数字,常用语知识库检索语义相似度比对。
    qwen3.6-max-preview
    qwen3.6-plus
    qwen3.6-flash
    qwen3-coder-plus
    支持协议:completions,messages,responses

  • 3、Deepseek
    深度求索: 模型 & 价格 | DeepSeek API Docs
    reasoner-深度思考,大量逻辑推导。编程用
    deepseek-v4-pro
    deepseek-v4-flash
    注:现有的deepseek-chat 与 deepseek-reasoner 两个模型名将于日后弃用。出于兼容考虑,二者分别对应 deepseek-v4-flash 的非思考与思考模式。
    支持协议:completions,messages

  • 4、GLM
    智谱: 模型概览 - 智谱AI开放文档
    glm-5.1,coding能力表示对齐Claude-opus-4.6
    glm-5,coding能力表示对齐Claude-opus-4.5,擅长 Agentic 长程规划与执行
    glm-4.7, 通用对话、推理与智能体能力升级
    支持协议:completions,messages

  • 5、MInimax
    上海稀宇科技:https://platform.minimaxi.com/docs/guides/models-intro#模型概览
    MiniMax-M2.7,官方表示能自行构建复杂Agent Harness
    MiniMax-M2.5
    支持协议:completions,messages

  • 6、mimo
    小米: Xiaomi MiMo API Open Platform
    MiMo-V2.5
    MiMo-V2
    支持协议:completions,messages

初始来源先于与Gemini pro的对话,之后去过所有官网查阅了信息,但文章都是自己编辑的,并未使用ai生成。如有错误请指出。

了解之后,我的感想是在做coding的时候,除gpt以外是有很多可以尝试的其他模型,不一定非要去挤拥挤的渠道。不过我现在还没有具体使用,可能需要等到实际用过之后更好发现差别。

我目前api的主要用途是帮忙编程和用于语言学习的文本对话,之后如果有试出可持续的方案,也会上来分享一下~

:grin:
然后感谢一下所有开公益站的各位朋友~太伟大惹~

1 个帖子 - 1 位参与者

阅读完整话题

来源: linux.do查看原文