命中 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

命中 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 121 篇相关文章 · 第 1 / 7 页

Codex:你的缓存命中比较低,但是呢你的额度又有效弥补了这一部分

这几天用 CodexManager ,发现缓存命中率特别低,30~40%,但觉得很耐用,怎么用都用不完。今天有空掏出来 CPA ,测试缓存到90%以上了,但是额度消耗又特别快。检查了 sevice_tier ,没有设置成 fast ,而且这个字段也在 new_api 也被过滤掉了

tech LinuxDo 最新话题 2026-05-24 16:52:50+08:00

有部分用户codex额度消耗很快,是gpt改了一些东西对缓存命中率产生了影响,说是已经修复

1 个帖子 - 1 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-24 16:52:23+08:00

想问一下CPA怎么设置缓存命中率高一些

这块的路由策略和会话粘性指的啥,没看懂 4 个帖子 - 3 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-24 04:01:04+08:00

永久降价 梁圣恩情还不完了

缓存命中率无敌啊 恩情 5 个帖子 - 4 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-23 12:53:51+08:00

关于NewAPI的缓存命中,求佬支招

本人前几天开了一台机器,机器上部署了cpa和newapi,然后给newapi接了同一个编排里的cpa做上游,cpa里是纯codex号池。 目前已经跑通了,给朋友也能用,但是我通过反复的试验和观察后台,发现朋友用的ccswitch接codex,基本都能缓存命中。 但是我自己使用的是

tech LinuxDo 最新话题 2026-05-22 01:59:42+08:00

openai的缓存为什么隔了3天还能命中

如图,三天没用了,在Codex里接着问,就发了一条请求,还能命中6.5k的缓存 4 个帖子 - 3 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-21 10:07:57+08:00

[推广] [送 $10] 被中转站扣费搞怕了,做了个工具专门看中转站 usage 透不透明、缓存命中问题

工具地址: https://aiapidoctor.com 最近自己的站点升级,但是发现各种 Claude / GPT / Gemini 接口和客户端配置。 折腾久了之后,发现很多站点是按照模板搭建的,但是后台有很多坑要填 (比如 模板就有空值扣费的问题,必须手动查缺补漏才行)

tech v2ex 2026-05-20 11:57:34+08:00

[推广] [送 $10] 被中转站扣费搞怕了,做了个工具专门看中转站 usage 透不透明、缓存命中问题

工具地址: https://aiapidoctor.com 最近自己的站点升级,但是发现各种 Claude / GPT / Gemini 接口和客户端配置。 折腾久了之后,发现很多站点是按照模板搭建的,但是后台有很多坑要填 (比如 模板就有空值扣费的问题,必须手动查缺补漏才行)

tech v2ex 2026-05-20 10:35:03+08:00

[推广] [送 $10] 被中转站扣费搞怕了,做了个工具专门看中转站 usage 透不透明、缓存命中问题

工具地址: https://aiapidoctor.com 最近自己的站点升级,但是发现各种 Claude / GPT / Gemini 接口和客户端配置。 折腾久了之后,发现很多站点是按照模板搭建的,但是后台有很多坑要填 (比如 模板就有空值扣费的问题,必须手动查缺补漏才行)

tech v2ex 2026-05-20 10:35:03+08:00

[推广] [送 $10] 被中转站扣费搞怕了,做了个工具专门看中转站 usage 透不透明、缓存命中问题

工具地址: https://aiapidoctor.com 最近自己的站点升级,但是发现各种 Claude / GPT / Gemini 接口和客户端配置。 折腾久了之后,发现很多站点是按照模板搭建的,但是后台有很多坑要填 (比如 模板就有空值扣费的问题,必须手动查缺补漏才行)

tech v2ex 2026-05-20 10:35:03+08:00

[推广] [送 $10] 被中转站扣费搞怕了,做了个工具专门看中转站 usage 透不透明、缓存命中问题

工具地址: https://aiapidoctor.com 最近自己的站点升级,但是发现各种 Claude / GPT / Gemini 接口和客户端配置。 折腾久了之后,发现很多站点是按照模板搭建的,但是后台有很多坑要填 (比如 模板就有空值扣费的问题,必须手动查缺补漏才行)

tech v2ex 2026-05-20 10:35:03+08:00

newAPI怎么查看缓存命中

用了一阵子newapi,应该怎么查看里面缓存命中,我看使用日志里面也没有显示,是要打开什么按钮吗? 8 个帖子 - 6 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-19 22:12:23+08:00

求助!!!CLIProxyAPI搓的api到claude中使用居然没用缓存

居然一点缓存没创建和命中是啥问题,还是我配置问题,用gemini cli的 OAuth登录没一点缓存,换成反重力就能有点缓存命中,之前用其他家的中转API缓存都能到90%左右 1 个帖子 - 1 位参与者 阅读完整话题

tech LinuxDo 最新话题 2026-05-19 15:28:54+08:00

Codex Desktop 频繁 Reconnecting解决

Codex Desktop 频繁出现 Reconnecting... ,根因大多是 OpenAI/ChatGPT 的 WebSocket 连接没有稳定命中代理。 解决思路: 确认 Clash Verge 本地端口,比如 127.0.0.1:7897 设置 Windows 用户级代

tech LinuxDo 最新话题 2026-05-16 22:51:40+08:00

关于Claude code调用第三方API会造成Token消耗增加、缓存命中率下降的改善

以下所有内容转载自微信视频号‘张司机在路上’博主的视频,有部份修改。 从2.1.36开始,A社很鸡贼的在Claude code里的API请求里塞了一行 x-anthropic-billing-header , 是当成system prompt的第一块发过去的. 里面有个叫 cch

tech LinuxDo 最新话题 2026-05-16 20:49:52+08:00

Harness 工程分享:我们怎么把 LLM Agent 的 prompt cache 命中率做到 90%+(附 4 家 Agent 横评数据)

接上一篇 https://v2ex.com/t/1211434 很多朋友好奇我们的工程实践,我把这二年的坑和 Ruby 重写的思考放出来,大家一起看看离 ClaudeCode 这种顶级 Harness 工程还有多远。 开篇 为了让新朋友重新了解一下我们的评测结果,我再列一下。 成

tech V2EX - 技术 2026-05-16 18:11:14+08:00

DS是否会倒逼其他模型提高缓存命中

最近用了一些DS, 性能中规中矩, 毕竟5.4用的比较多了, 但是它的缓存命中比较惊喜, 尤其是在CLAUDE中用的时候. 目前似乎多数模型的缓存命中都没这么高, 那么问题来了, 佬友们觉得DS的这个缓存命中是否会倒逼其他友商提高下一代的模型的缓存命中性能呢 6 个帖子 - 5

tech LinuxDo 最新话题 2026-05-16 13:10:14+08:00

Harness 工程分享:我们怎么把 LLM Agent 的 prompt cache 命中率做到 90%+(附 4 家 Agent 横评数据)

接上一篇 https://v2ex.com/t/1211434 很多朋友好奇我们的工程实践,我把这二年的坑和 Ruby 重写的思考放出来,大家一起看看离 ClaudeCode 这种顶级 Harness 工程还有多远。 开篇 为了让新朋友重新了解一下我们的评测结果,我再列一下。 成

tech V2EX - 技术 2026-05-16 05:13:06+08:00

Harness 工程分享:我们怎么把 LLM Agent 的 prompt cache 命中率做到 90%+(附 4 家 Agent 横评数据)

接上一篇 https://v2ex.com/t/1211434 很多朋友好奇我们的工程实践,我把这二年的坑和 Ruby 重写的思考放出来,大家一起看看离 ClaudeCode 这种顶级 Harness 工程还有多远。 开篇 为了让新朋友重新了解一下我们的评测结果,我再列一下。 成

tech V2EX - 技术 2026-05-15 23:08:14+08:00

Harness 工程分享:我们怎么把 LLM Agent 的 prompt cache 命中率做到 90%+(附 4 家 Agent 横评数据)

接上一篇 https://v2ex.com/t/1211434 很多朋友好奇我们的工程实践,我把这二年的坑和 Ruby 重写的思考放出来,大家一起看看离 ClaudeCode 这种顶级 Harness 工程还有多远。 开篇 为了让新朋友重新了解一下我们的评测结果,我再列一下。 成

tech V2EX - 技术 2026-05-15 23:08:14+08:00