mtp - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

mtp - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 5 篇相关文章

谷歌为 Gemma 4 系列 AI 模型推出 MTP 起草器,推理速度最高提升 3 倍

IT之家 5 月 7 日消息,谷歌于 5 月 5 日发布博文,宣布为 Gemma 4 系列 AI 模型,推出多 Token 预测(MTP)起草器, 利用推测解码架构,推理速度最高可提升 3 倍。 Gemma 4 作为谷歌目前能力最强的开源模型,在发布仅数周内下载量已突破 6000

tech IT之家 2026-05-07 14:43:07+08:00

用 Resend + Cloudflare 给自己的域名配置 SMTP 发信

这是一份偏实战的记录:目标是让自己的站点可以用 xxx@your-domain.com 发送注册验证码、余额提醒、系统通知等邮件。这里以 Resend + Cloudflare DNS 为例,截图里的账号、长 DKIM、公网配置等关键信息已经做了打码或缩略,实际配置时请以你自己

tech LinuxDo 最新话题 2026-05-07 08:28:52+08:00

gemma4:31b-coding-mtp-bf16

https://ollama.com/library/gemma4:31b-coding-mtp-bf16 本地部署的时候,Best Practices 部分有一些有用信息。

tech V2EX - 技术 2026-05-06 19:10:09+08:00

分享 gpt-5.5/5.4

baseUrl: 剧透 key: NksrM1ltRnpaVFkwWkdWamIyUmxNdWFzb2UrOG1pQnpheTB5TlRSbE5UWTRNV0V4TUdJd01EUmtPRGd4Tm1FNFpXVmlZekZtTkdGa09HSmlOak13WVdZd09XWmp

tech linux.do 2026-05-02 00:36:50+08:00

MTP 太强了!为什么 Gemma4 不支持 MTP...

最近在尝试本地部署 Qwen3.6-27B 和 Gemma4-31B,发现因为是 Dense 模型,两者的生成速度都挺慢(相比 200多 B 的 MoE 模型而言,速率还低了一半,只有约 25-30 token/s)。但是我发现 Qwen3.6 支持 Multi-Token Pr

tech linux.do 2026-04-27 18:50:11+08:00