算子 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

算子 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 6 篇相关文章

tilelang前景与国产替代

DS3.2开始使用tilelang写算子,开发效率和执行效率都有提升 想问论坛的佬怎么看这个项目 我看生态位tilelang是cuda以上的,感觉对于国产的意义巨大 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-26 17:16:04+08:00

[酷工作] [北京上海无锡]基础框架/高性能算子多个方向

关于太初电子科技 太初(无锡)电子科技有限公司,自 2019 年成立以来,始终坚持以“铸造中国算力基石,构建未来智能世界”为使命,立足于高性能计算产业核心基座,布局自主可控、通用开放、性能完善的先进智能计算生态。面向政府和企业用户,建设高性能、高能效、高可靠的智能算力系统,深度定

tech v2ex.com 2026-04-26 17:13:46+08:00

DeepSeek 开源 TileKernels:高性能 GPU 算子库瞄准大模型训练与推理,支持 NVIDIA Blackwell

来源 4 个帖子 - 4 位参与者 阅读完整话题

tech linux.do 2026-04-23 22:20:24+08:00

DeepSeek 开源 TileKernels 算子库,支持 NVIDIA Blackwell 架构

DeepSeek 于 4 月 22 日开源高性能 GPU 算子库 TileKernels,该项目基于 TileLang 开发。该库针对大语言模型(LLM)的训练与推理进行了深度优化,其算子性能已接近硬件计算强度与内存带宽的极限。 TileKernels 涵盖了 MoE 路由、FP

tech linux.do 2026-04-23 18:03:45+08:00

DeepSeek开源TileKernels:面向大语言模型的GPU算子库

DeepSeek于刚刚在GitHub上开源了名为 TileKernels 的GPU算子项目,该仓库以MIT协议发布,定位为面向大语言模型训练与推理场景的高性能GPU算子集合,底层基于TileLang构建。作者署名包括王翔文、徐晨浩、曹焕琪、田瑞、赵伟霖、余快与赵成钢。 githu

tech linux.do 2026-04-23 17:29:18+08:00

Intel Arc Alchemist XPU 运行 Qwen 3.5 / Qwen 3.6 / Gemma 4 并支持MoE (系列之三,教你如何自己写算子)

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺

tech linux.do 2026-04-17 18:07:37+08:00