TOKENS - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第5页 - 钛刻科技 | TCTI.cn

TOKENS - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第5页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 83 篇相关文章 · 第 5 / 5 页

8xa40服务器部署全精qwen27b,首发延迟高,约10s,速度慢,90-100tokens/s,何解

鄙人使用学校的8xa40-Pcle服务器,使用vllm部署全精qwen27b,首发延迟高,约10s,速度慢,90-100tokens/s,看到很多人用3090部署速度都没这么慢,这是为什么?有没有推荐部署的模型,27b对显存浪费有点大,不过pcle带宽比较低 12 个帖子 - 5

tech linux.do 2026-04-19 12:46:04+08:00

tokens去哪搞(不要中转)

不走小中转站 ,哪家的官方渠道是最值得买的,应用场景,代码编写,资料整理,科研任务。用过智谱pro minimax plus 。在考虑重新选择,或许云厂商也行? 8 个帖子 - 7 位参与者 阅读完整话题

tech linux.do 2026-04-18 16:25:05+08:00

谷歌云AI使用量达到每分钟160亿Tokens

谷歌表示,通过客户直接使用API,现在每分钟处理超过160亿Tokens,高于上季度的100亿个。(财联社)

tech 36kr.com