看了这篇文章有感
tilert.ai
速度:大模型推理的下一个 Scaling Law
深度解析 TileRT 高性能推理引擎及 GLM-5.1 生产级实践。
再看看数据
Gemini 3.5 Flash - 289 token/s - 2026/05/20
GLM 5.1 HighSpeed - 400 token/s - 2026/05/22
SRAM 路线的 Groq 被 NVIDIA 收购了(2025/12/24)先不谈,大芯片路线的 Cerebras 才刚上市(2026/05/14),感觉是很大的利空啊,但股价好像没受到什么打击
本帖子仅代表个人观点,不构成投资建议
1 个帖子 - 1 位参与者