首页
/
科技 / DeepSeek 开源 TileKernels 算子库,支持…
DeepSeek 开源 TileKernels 算子库,支持 NVIDIA Blackwell 架构
编辑部
2026-05-04T18:03:45.318540
34430 阅读 tech
DeepSeek 于 4 月 22 日开源高性能 GPU 算子库 TileKernels,该项目基于 TileLang 开发。该库针对大语言模型(LLM)的训练与推理进行了深度优化,其算子性能已接近硬件计算强度与内存带宽的极限。 TileKernels 涵盖了 MoE 路由、FP8/FP4 量化及多...
DeepSeek 开源 TileKernels 算子库,支持 NVIDIA Blackwell 架构
DeepSeek 于 4 月 22 日开源高性能 GPU 算子库 TileKernels,该项目基于 TileLang 开发。该库针对大语言模型(LLM)的训练与推理进行了深度优化,其算子性能已接近硬件计算强度与内存带宽的极限。
TileKernels 涵盖了 MoE 路由、FP8/FP4 量化及多种融合算子,并已在 DeepSeek 内部环境投入使用。该库目前适配 NVIDIA SM90 及最新的 SM100(Blackwell)架构,运行环境要求 CUDA 13.1 及以上版本。
Github
1 个帖子 - 1 位参与者
阅读完整话题