近期国内外模型速度都有很大的突破,感觉 Cerebras 等厂商危险了啊

看了这篇文章有感 tilert.ai 速度:大模型推理的下一个 Scaling Law 深度解析 TileRT 高性能推理引擎及 GLM-5.1 生产级实践。 再看看数据 Gemini 3.5 Flash - 289 token/s - 2026/05/20 GLM 5.1 HighSpeed - ...
近期国内外模型速度都有很大的突破,感觉 Cerebras 等厂商危险了啊
近期国内外模型速度都有很大的突破,感觉 Cerebras 等厂商危险了啊

看了这篇文章有感

tilert.ai

速度:大模型推理的下一个 Scaling Law

深度解析 TileRT 高性能推理引擎及 GLM-5.1 生产级实践。

再看看数据

Gemini 3.5 Flash - 289 token/s - 2026/05/20
GLM 5.1 HighSpeed - 400 token/s - 2026/05/22

SRAM 路线的 Groq 被 NVIDIA 收购了(2025/12/24)先不谈,大芯片路线的 Cerebras 才刚上市(2026/05/14),感觉是很大的利空啊,但股价好像没受到什么打击

图片


本帖子仅代表个人观点,不构成投资建议

1 个帖子 - 1 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文