小白写，小白看的常见主流模型分类

编辑部 2026-05-05T16:32:01.104871 20298 阅读综合

发文是因为本编程小白在L站蹭了很多公益站，半摸瞎地搞了一些小工具。但是很多时候因为对各个模型不够了解，无脑选gpt的模型，想想有些简单功能或许用不上牛刀，感觉有些浪费。所以做一个整理，方便跟我一样的小白对模型有个大概的了解，在选择模型时稍微有些方向。此文用词不会专业（能力受限），只是一位行外人很浅...

发文是因为本编程小白在L站蹭了很多公益站，半摸瞎地搞了一些小工具。但是很多时候因为对各个模型不够了解，无脑选gpt的模型，想想有些简单功能或许用不上牛刀，感觉有些浪费。所以做一个整理，方便跟我一样的小白对模型有个大概的了解，在选择模型时稍微有些方向。

此文用词不会专业（能力受限），只是一位行外人很浅层的理解，因为初衷其实是我想看懂这些没有被统一度量衡的模型。表达或理解有误之处欢迎指正。

通用含义：

Pro/Max/Expert，thinking/reasoner/reasoning/r-能力最强，思考时间长，也最贵，适合复杂任务；
Plus-效果平衡；
mini/Flash/Fast/Lite/air-适合简单任务，速度快；
nano-最小模型，处理及其简单的拼写、分类等轻量任务；
Coder/Codex/Code-工具调用，环境交互，编程用；
VL-视觉理解，文本外还可输入图像及视频；
Omni-全模态，文图音视;
instruct/chat-对话聊天；
preview-抢先版，最新，但可能不稳定；
oss- Open Source Software，开源模型
search/web-具备联网搜索能力

通用协议：

completions
- 出品方：openai
- 最古典、最通用、最主流的 llm 对话调用接口标准
messages
- 出品方：anthropic
- 首个和 openai 分庭抗礼的角色，就是要和 openai 不一样，尽管刚开始的时候接口字段相当接近，A\ 仍然选择搞一个独特的路由接口标准，但是现在又悄咪咪兼容了 completions 接口，claude code 大大提高了 messages 接口的流行度
responses
- 出品方：openai
- openai 推行的面向 agent 的下一代 api 标准，内置工具、提供有状态上下文，Codex 专属接口，chat 转 codex 可使用 cpa 等工具，且性能可能有损失
X
- 烂中烂，包括但不限于 Google 等厂商把模型、api 参数嵌入 url 中的各种奇形怪状标准

以下模型分类来自我在用的各个公益站的模型广场，列出的是最新的一些模型，信息来源为参考网站：

国外部分：

1、Open AI
我想在座的各位无人不识Chatgpt：https://openai.com/api/
gpt-5.5，最新模型，处理最复杂的工作；
gpt-5.3-Codex，擅长agentic tasks，质量平衡，处理复杂开发任务；
gpt-5-mini，适合大多数编码
支持协议：completions，responses
2、Claude
Anthropic公司： Plans & Pricing | Claude by Anthropic
claude-haiku-4-5-20251001，速度最快，轻量模型
claude-sonnet-4-6，体量适中，最平衡
claude-opus-4-7，处理最复杂逻辑推理
支持协议：messages，completions
3、Grok
马斯克旗下xAI： Models and Pricing | xAI Docs
（除了图视音，官方强烈建议都用grok-4.3）
grok-4.3
grok-4.20-0309-reasoning
grok-4.20-0309-non-reasoning
支持协议：copmpletions，responses
4、Gemini
谷歌：https://ai.google.dev/gemini-api/docs/models
Gemini-3.1-Pro
Gemini-3-Flash
Gemini-3.1-Flash-Lite
支持协议：x，completions

国内部分：

1、Kimi
月之暗面：模型列表 - Kimi API 开放平台
kimi-k2.6，coding模型，具备长程编码能力
moonshot-v1，简单文字任务
支持协议：completions，messages
2、Qwen
阿里巴巴：通义实验室 | Qwen
B- Billion，前面数字越大，代表参数量越大，能力越强，越耗费算力。
例：小参数（8B，14B）；中等参数（32B，72B）；大型参数（110B）
Embedding-嵌入模型，非直接对话，目的是把输入内容转为计算机能理解的数字，常用语知识库检索语义相似度比对。
qwen3.6-max-preview
qwen3.6-plus
qwen3.6-flash
qwen3-coder-plus
支持协议：completions，messages，responses
3、Deepseek
深度求索：模型 & 价格 | DeepSeek API Docs
reasoner-深度思考，大量逻辑推导。编程用
deepseek-v4-pro
deepseek-v4-flash
注：现有的deepseek-chat 与 deepseek-reasoner 两个模型名将于日后弃用。出于兼容考虑，二者分别对应 deepseek-v4-flash 的非思考与思考模式。
支持协议：completions，messages
4、GLM
智谱：模型概览 - 智谱AI开放文档
glm-5.1，coding能力表示对齐Claude-opus-4.6
glm-5，coding能力表示对齐Claude-opus-4.5，擅长 Agentic 长程规划与执行
glm-4.7, 通用对话、推理与智能体能力升级
支持协议：completions，messages
5、MInimax
上海稀宇科技：https://platform.minimaxi.com/docs/guides/models-intro#模型概览
MiniMax-M2.7，官方表示能自行构建复杂Agent Harness
MiniMax-M2.5
支持协议：completions，messages
6、mimo
小米： Xiaomi MiMo API Open Platform
MiMo-V2.5
MiMo-V2
支持协议：completions，messages

初始来源先于与Gemini pro的对话，之后去过所有官网查阅了信息，但文章都是自己编辑的，并未使用ai生成。如有错误请指出。

了解之后，我的感想是在做coding的时候，除gpt以外是有很多可以尝试的其他模型，不一定非要去挤拥挤的渠道。不过我现在还没有具体使用，可能需要等到实际用过之后更好发现差别。

我目前api的主要用途是帮忙编程和用于语言学习的文本对话，之后如果有试出可持续的方案，也会上来分享一下～

然后感谢一下所有开公益站的各位朋友～太伟大惹～

1 个帖子 - 1 位参与者

阅读完整话题

来源: linux.do查看原文

小白常见主流模型分类一个帖子问与答

小白写，小白看的常见主流模型分类

通用含义：

本田电动化豪赌失利，多款热门车型换代延期至 2030 年后

[宽带症候群] 你们现在都在用什么协议，我怎么感觉老协议更稳

通用协议：

国外部分：

国内部分：

相关推荐