我对各个 AI 公司的期望是这样的,分为四个梯队,第一梯队最好,第四梯队最差
当然,模型能力不是本人唯一的评价标准,本人还考虑了各公司对用户的态度、公司的声誉等等,可能存在不准确的地方,仅供参考
第一梯队:Google(Gemini)、月之暗面(Kimi)、OpenAI(GPT)、DeepSeek
- Google 的模型还是挺不错的,Gemini 模型上下文 100 万,而且 AI Studio 网页端一天还可以用很多次,而且还很可靠。
- Kimi 还可以,Agent 模式能搞出简单的项目,唯一的缺点是免费用户体验差(三色图.jpg)
- OpenAI 的 GPT 模型也很出色,虽然以前会说“稳稳接住你”,让人感到恶心,不过好在它的 GPT Image 2(我只在 Arena 用过,官方的网页端和 APP 出不了,因为我是 Free 账号)图片质量还挺好。
- DeepSeek 可以说是国内最厉害的 AI 公司了,现在的 DeepSeek 还是很强的,已经有 100 万上下文了,不过 DeepSeek V4 还有几个月才出,相信出来之后应该很强。
第二梯队:字节跳动(豆包)、X(Grok)、阿里巴巴(Qwen)、Minimax
- 豆包的生图能力也很强,不过文本生成的话跟 Kimi 和 Gemini 比还是有一定差距的,希望豆包继续加油
- Grok 的风格还是很不错的,是我见过的最像人的模型,虽然个人感觉跟 Google 的 Gemini 还是有一定差距
- Qwen 模型还是挺强的,但是最近阿里把 Coding Lite 下架了…
- Minimax 模型的话,感觉还在起步阶段,未来五年能成什么样,存在很大的不确定性
第三梯队:智谱(GLM)、Meta(Muse Spark)、讯飞(讯飞星火)、腾讯(元宝)
- GLM 在国内还可以,但是最近智谱对用户的态度有待提高,希望智谱内部管理能加强吧
- Meta 以前是做开源模型的,但自从 Llama 4 爆雷之后,本人对 Meta 的期望有所降低,后来,Meta 再也回不去了,开始闭源…
- 讯飞星火还可以,比文心一言好一点
- 元宝的话同上,也是比文心一言好
第四梯队:Anthropic(Claude)、百度(文心一言)
- 不得不承认,Anthropic 确实搞出了厉害的 Mythos(可惜普通用户用不了),但 Anthropic 搞出了 KYC,国内用户越来越受限,如果肉身还在国内的话建议转战第一或第二梯队
- 百度的名声早些年就已经臭了,后面推出的文心一言,质量不是很好,如果说百度能用心做产品,我是不太相信的
6 个帖子 - 6 位参与者