Codex:你的缓存命中比较低,但是呢你的额度又有效弥补了这一部分
这几天用 CodexManager ,发现缓存命中率特别低,30~40%,但觉得很耐用,怎么用都用不完。今天有空掏出来 CPA ,测试缓存到90%以上了,但是额度消耗又特别快。检查了 sevice_tier ,没有设置成 fast ,而且这个字段也在 new_api 也被过滤掉了
命中 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 121 篇相关文章 · 第 1 / 7 页
这几天用 CodexManager ,发现缓存命中率特别低,30~40%,但觉得很耐用,怎么用都用不完。今天有空掏出来 CPA ,测试缓存到90%以上了,但是额度消耗又特别快。检查了 sevice_tier ,没有设置成 fast ,而且这个字段也在 new_api 也被过滤掉了
1 个帖子 - 1 位参与者 阅读完整话题
这块的路由策略和会话粘性指的啥,没看懂 4 个帖子 - 3 位参与者 阅读完整话题
缓存命中率无敌啊 恩情 5 个帖子 - 4 位参与者 阅读完整话题
本人前几天开了一台机器,机器上部署了cpa和newapi,然后给newapi接了同一个编排里的cpa做上游,cpa里是纯codex号池。 目前已经跑通了,给朋友也能用,但是我通过反复的试验和观察后台,发现朋友用的ccswitch接codex,基本都能缓存命中。 但是我自己使用的是
如图,三天没用了,在Codex里接着问,就发了一条请求,还能命中6.5k的缓存 4 个帖子 - 3 位参与者 阅读完整话题
工具地址: https://aiapidoctor.com 最近自己的站点升级,但是发现各种 Claude / GPT / Gemini 接口和客户端配置。 折腾久了之后,发现很多站点是按照模板搭建的,但是后台有很多坑要填 (比如 模板就有空值扣费的问题,必须手动查缺补漏才行)
工具地址: https://aiapidoctor.com 最近自己的站点升级,但是发现各种 Claude / GPT / Gemini 接口和客户端配置。 折腾久了之后,发现很多站点是按照模板搭建的,但是后台有很多坑要填 (比如 模板就有空值扣费的问题,必须手动查缺补漏才行)
工具地址: https://aiapidoctor.com 最近自己的站点升级,但是发现各种 Claude / GPT / Gemini 接口和客户端配置。 折腾久了之后,发现很多站点是按照模板搭建的,但是后台有很多坑要填 (比如 模板就有空值扣费的问题,必须手动查缺补漏才行)
工具地址: https://aiapidoctor.com 最近自己的站点升级,但是发现各种 Claude / GPT / Gemini 接口和客户端配置。 折腾久了之后,发现很多站点是按照模板搭建的,但是后台有很多坑要填 (比如 模板就有空值扣费的问题,必须手动查缺补漏才行)
工具地址: https://aiapidoctor.com 最近自己的站点升级,但是发现各种 Claude / GPT / Gemini 接口和客户端配置。 折腾久了之后,发现很多站点是按照模板搭建的,但是后台有很多坑要填 (比如 模板就有空值扣费的问题,必须手动查缺补漏才行)
用了一阵子newapi,应该怎么查看里面缓存命中,我看使用日志里面也没有显示,是要打开什么按钮吗? 8 个帖子 - 6 位参与者 阅读完整话题
居然一点缓存没创建和命中是啥问题,还是我配置问题,用gemini cli的 OAuth登录没一点缓存,换成反重力就能有点缓存命中,之前用其他家的中转API缓存都能到90%左右 1 个帖子 - 1 位参与者 阅读完整话题
Codex Desktop 频繁出现 Reconnecting... ,根因大多是 OpenAI/ChatGPT 的 WebSocket 连接没有稳定命中代理。 解决思路: 确认 Clash Verge 本地端口,比如 127.0.0.1:7897 设置 Windows 用户级代
以下所有内容转载自微信视频号‘张司机在路上’博主的视频,有部份修改。 从2.1.36开始,A社很鸡贼的在Claude code里的API请求里塞了一行 x-anthropic-billing-header , 是当成system prompt的第一块发过去的. 里面有个叫 cch
接上一篇 https://v2ex.com/t/1211434 很多朋友好奇我们的工程实践,我把这二年的坑和 Ruby 重写的思考放出来,大家一起看看离 ClaudeCode 这种顶级 Harness 工程还有多远。 开篇 为了让新朋友重新了解一下我们的评测结果,我再列一下。 成
最近用了一些DS, 性能中规中矩, 毕竟5.4用的比较多了, 但是它的缓存命中比较惊喜, 尤其是在CLAUDE中用的时候. 目前似乎多数模型的缓存命中都没这么高, 那么问题来了, 佬友们觉得DS的这个缓存命中是否会倒逼其他友商提高下一代的模型的缓存命中性能呢 6 个帖子 - 5
接上一篇 https://v2ex.com/t/1211434 很多朋友好奇我们的工程实践,我把这二年的坑和 Ruby 重写的思考放出来,大家一起看看离 ClaudeCode 这种顶级 Harness 工程还有多远。 开篇 为了让新朋友重新了解一下我们的评测结果,我再列一下。 成
接上一篇 https://v2ex.com/t/1211434 很多朋友好奇我们的工程实践,我把这二年的坑和 Ruby 重写的思考放出来,大家一起看看离 ClaudeCode 这种顶级 Harness 工程还有多远。 开篇 为了让新朋友重新了解一下我们的评测结果,我再列一下。 成
接上一篇 https://v2ex.com/t/1211434 很多朋友好奇我们的工程实践,我把这二年的坑和 Ruby 重写的思考放出来,大家一起看看离 ClaudeCode 这种顶级 Harness 工程还有多远。 开篇 为了让新朋友重新了解一下我们的评测结果,我再列一下。 成