Cache - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

Cache - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 11 篇相关文章

AMD 锐龙 9 PRO 9965X3D 商用 3D V-Cache 处理器现身基准测试

IT之家 5 月 4 日消息,AMD 首款 MSDT 级商用 3D V-Cache 处理器锐龙 9 PRO 9965X3D 的传闻至少可追溯到 2025 年 11 月,而在半年之后 这一型号也终于出现在了 PassMark 基准测试数据库中 : 可以看到 PassMark 对这款

tech www.ithome.com 2026-05-04 12:43:00+08:00

xiaomimimo计费模式

申请通过了xiaomimimo的pro 获得了7亿的token 试用了一下发现了一个问题 token的扣减是包括cache token 所以个人的观念现阶段看着只能自己作为api处理非重复数据 接入agent做主力开发不合适 除非将来xiaomi修改计费方式 要不然作为开发辅助比

tech linux.do 2026-05-02 12:18:12+08:00

对于 gpt 模型和 claude code 上缓存的思考 / auto prefix cache vs. cache control

关于之前的帖子,我有过关于 claude code 缓存的疑问,我后面更新了一下,决定再开一篇帖子,转述一遍,从评论区转述我自己哈哈 OpenAI Response 缓存字段分析,OpenCode,Codex,CC-Switch,中转厂商,New API 开发调优 经过我的一些调

tech linux.do 2026-05-01 16:25:50+08:00

佬们sub2api代理gpt5.5给cc没有cache

有没有佬遇到过这样的问题,在sub2api里用oauth登陆codex。 然后用cc链接sub2api里的codex的gpt5.5,发现完全没有cache。这该怎么修改呢 1 个帖子 - 1 位参与者 阅读完整话题

tech linux.do 2026-04-30 08:51:03+08:00

虚假的编码套餐 429, 真实的编码套餐输入缓存命中折扣 99.17%

https://coding-plans.jqknono.com/?metricsCacheDiscount=yes&metricsModel=deepseek%2Fdeepseek-v4-pro#metrics 部分"night"套餐也别做了, 做好

tech www.v2ex.com 2026-04-29 14:12:22+08:00

如果直接使用deepseekv4的api, 4月的花费

“input”: 210100299 “output”: 4082460 “cacheRead”: 986467554 “cacheWrite”: 2078702 如果全部使用deepeek-v4 pro的话, 花费大概: 210 * 12 + 4 * 24 + 986 + 2

tech linux.do 2026-04-24 11:54:11+08:00

Windsurf 模型总表,opus4.7 半价到4.30号

价格其实说明了点东西 分类 模型 Context Input Cached Input Output 备注 Anthropic Claude Opus 4.7 Max 1M $2.5 / 1M tokens $0.25 / 1M tokens $12.5 / 1M tokens

tech linux.do 2026-04-21 18:31:59+08:00

RAG AI 测试:AMD 3D V-Cache 比非 X3D 型号处理器性能最高提升 88%

IT之家 4 月 21 日消息,gigglehd 最新报告指出,在 RAG(检索增强生成)AI 基准测试中, 相比较非 X3D 型号处理器,AMD 的 3D V-Cache 处理器性能最高可提升 88%。 IT之家注:RAG(检索增强生成)是一种结合外部数据库检索与生成能力的 A

tech www.ithome.com 2026-04-21 09:14:20+08:00

Windsurf 白嫖价格统计,opus4.7 半价促销到4.30

Windsurf 模型总表 分类 模型 Context Input Cached Input Output 备注 Anthropic Claude Opus 4.7 Max 1M $2.5 / 1M tokens $0.25 / 1M tokens $12.5 / 1M toke

tech linux.do 2026-04-20 19:46:34+08:00

Intel终于拿出对付3D缓存的绝招:288MB bLLC大平层缓存暴力碾压AMD

凭借3D V-Cache的优势,这两年AMD的桌面U一直在游戏性能上把Intel按在地上摩擦。 但Intel必然不会一直甘居人后,终于拿出了对抗X3D的终极大招——bLLC(Big Last-Level Cache,大型末级缓存)。 作为Intel为其下一代 Nova Lake-

tech plink.anyfeeder.com 2026-04-19 15:06:18+08:00

郭明錤:不存在“压缩KV Cache就能消除内存需求”的逻辑

知名分析师郭明錤发文表示,最近发生的三件看似独立的事件正在从不同层面缓解内存瓶颈的影响。分别是:英伟达:通过Groq 3 LPX稳定低延迟输出以提升Token价值;谷歌:利用TurboQuant最大化基础设施利用率;Anthropic:支持长时间运行的有状态代理架构。郭明錤表示,

tech 36kr.com