谷歌开源Diffusion Gemma,可在h100上跑出1000tps
Blazing fast inference: By shifting the decode bottleneck from memory-bandwidth to compute, DiffusionGemma generates up to 4x faster token o
h100 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 6 篇相关文章
Blazing fast inference: By shifting the decode bottleneck from memory-bandwidth to compute, DiffusionGemma generates up to 4x faster token o
IT之家 5 月 27 日消息,B&O(铂傲、Bang & Olufsen)联名藤原浩 Fragment Design,推出四款 B&O 音频产品的联名版, 售价 3198 元起 : 便携式音箱 Beosound A1:3198 元 头戴式耳机 Beopl
MTT S5000 AI 训推一体智算卡基于 PH100 芯片打造,单卡 AI 算力(稠密)可达 1000 TFLOPS,具备 80GB 显存(带宽 1.6TB/s),卡间互联带宽为 784GB/s,满足多精度算力需求。国产显卡也越来越好了! 1 个帖子 - 1 位参与者 阅读完
IT之家 5 月 26 日消息,中国信息安全测评中心、国家保密科技测评中心今天公布《安全可靠测评结果公告(2026 年第 2 号)》, 摩尔线程 MTT S5000(PH100 芯片)人工智能训练推理芯片在列 。 IT之家注意到,摩尔线程刚刚也在公众号平台发布了这则喜讯。官方表示
用SpaceXAI的Colossus2提供的百万级H100算力,搭配Moonshot 的 Kimi K2.5为训练底座,整出来了这个↓:(看上去挺强的啊,那以后要主推自家模型了吗)。 不知道实际水平到底怎么样,长程任务稳不稳定 7 个帖子 - 5 位参与者 阅读完整话题
果然做LLM还是要去企业做,学校还是太穷了,五一期间趁大家下班卡多,跑两篇neurips 11 个帖子 - 5 位参与者 阅读完整话题