提供一些最近玩耍发现的一些东西吧,就是因为没钱没token才这么灰头土脸到处找途径挖模型用
结果发现花的时间太多了,正事反而没干了。
什么时候能实现token自由。。。。虽然dpsk已经很便宜了,但裤兜还是有点紧。
AnyRoute
claude-opus-4-7 流式请求没返回, 可以通过非流式请求
claude code会默认先请求stream传输,流式响应为空后会fallback到非流式
不知道通过环境变量缩短请求超时时间和请求重试次数,能不能让他更快降级到非流式请求
通过system内容是否包含有claude code自带系统提示词来判断请求是否来自cc
// 为了绕过 AnyRoute 对 CC 检测
export const ClaudeCodeSystemPrompt: TextBlockParam = {
type: 'text',
text: "You are Claude Code, Anthropic's official CLI for Claude.",
cache_control: { type: 'ephemeral' },
};
而且metadata字段也要有
metadata: {
user_id: JSON.stringify({
device_id: this.deviceId,
account_id: '',
session_id: this.sessionId,
}),
},
不支持大图片上传,AnyRoute服务器不让,entity too large
不要用太多的cache_control: ephemeral,服务器会返回520
GitHub Copilot auto 模型选择
copilot学生套餐现在每周都限额,就那么一点点用光就不让你自己选择模型了。但是Auto还是可以收到响应,只是它通常给你选的都是gpt-5-mini最烂的模型,用着很不爽。
Auto的工作逻辑如下
第一步:请求/models/session拿到sessionToken
第二步:带着Copilot-Session-Token:sessionToken发给/models/session/intent,根据用户提示词看看选哪个模型(他背后经常拿GPT-4旧模型来做一些对用户行为的预测)
第三步: 带着Copilot-Session-Token:sessionToken和第二步给出的建议模型发请求
---
Auto 模式——3 次请求链路
Conversation Start
│
├─ 请求 1: AutoMode Token 获取
│ POST https://api.individual.githubcopilot.com/models/session
│ Headers:
│ Authorization: Bearer {token}
│ Content-Type: application/json
│ X-GitHub-Api-Version: 2025-10-01
│ Copilot-Integration-Id: vscode-chat
│ Body: { "auto_mode": { "model_hints": ["auto"] } }
│
├─ 请求 2: Router 决策(仅首轮+prompt变化时,1s 超时)
│ POST https://api.individual.githubcopilot.com/models/session/intent
│ Headers:
│ Authorization: Bearer {token}
│ Copilot-Session-Token: {session_token}
│ Body: {
│ "prompt": "用户输入",
│ "available_models": [...],
│ "turn_number": 1,
│ "previous_model": null,
│ "reference_count": 3,
│ "prompt_char_count": 156
│ }
│
└─ 请求 3: 实际聊天
POST https://api.individual.githubcopilot.com/chat/completions (ChatCompletions)
或 POST https://api.individual.githubcopilot.com/responses (Responses API)
或 POST https://api.individual.githubcopilot.com/v1/messages (Anthropic Messages)
---
特定模型 (如 gpt-5-mini)——1 次请求链路
Conversation Start
│
└─ 请求 1: 直接聊天 (无额外请求!)
POST https://api.individual.githubcopilot.com/chat/completions
或 POST https://api.individual.githubcopilot.com/responses
---
auto模式只能请求到这些模型:
- “gpt-5-mini”,
- “gpt-5.4-mini”,
- “gpt-5.3-codex”,
- “gpt-4o”,
- “gpt-4.1”
auto模式之所以请求让你通过而不是429 user_weekly_rate_limited,原因就在于他多提供了一个http验证Copilot-Session-Token: {session_token}
知道这个之后,vibe coding魔改一下开源工作copilot-bridge(fork from copilot-api),就可以把copilot模型接出来给Claude Code用了,而且可以用点gpt-5.3-codex而不是老是gpt-5-mini。
BYOK For Copilot
插件新开发了一版:
现在我们专门用来管理多个第三方api或公益站api。
通过模型管理器的添加模型选择BYOK提供商,或者ctrl+shift+p打开命令面板允许BYOK:添加站点,可以添加第三方站点信息,然后会从/v1/models自动获取可用模型,如果没有你要自己输入模型。
如果你提供了很多个第三方站点,他们都提供一个相同的模型,你可以和方便的通过模型旁边的设置切换(就是你如何切换模型思考effort,你就如何切换提供商),比如AnyRoute和AgentRouter如果都有claude-opuis-4-7,你就可以鼠标悬浮在模型名字上等待配置显示,切换提供商。
目前autocopilot功能还有问题,开启autocopilot后模型返回为空不知道为什么。
写在最后
感觉东西不是很有价值,要开始赶作业了,也有点懒就没有把代码传到github。后续有时间再研究吧。。。
1 个帖子 - 1 位参与者