一些小的发现

编辑部 2026-05-16T21:51:58.492961 10365 阅读 tech

提供一些最近玩耍发现的一些东西吧，就是因为没钱没token才这么灰头土脸到处找途径挖模型用结果发现花的时间太多了，正事反而没干了。什么时候能实现token自由。。。。虽然dpsk已经很便宜了，但裤兜还是有点紧。 AnyRoute claude-opus-4-7 流式请求没返回，可以通过非流式请...

提供一些最近玩耍发现的一些东西吧，就是因为没钱没token才这么灰头土脸到处找途径挖模型用

结果发现花的时间太多了，正事反而没干了。

什么时候能实现token自由。。。。虽然dpsk已经很便宜了，但裤兜还是有点紧。

AnyRoute

claude-opus-4-7 流式请求没返回，可以通过非流式请求

claude code会默认先请求stream传输，流式响应为空后会fallback到非流式

不知道通过环境变量缩短请求超时时间和请求重试次数，能不能让他更快降级到非流式请求

通过system内容是否包含有claude code自带系统提示词来判断请求是否来自cc

// 为了绕过 AnyRoute 对 CC 检测
export const ClaudeCodeSystemPrompt: TextBlockParam = {
    type: 'text',
    text: "You are Claude Code, Anthropic's official CLI for Claude.",
    cache_control: { type: 'ephemeral' },
};

而且metadata字段也要有

metadata: {
    user_id: JSON.stringify({
        device_id: this.deviceId,
        account_id: '',
        session_id: this.sessionId,
    }),
},

不支持大图片上传，AnyRoute服务器不让，entity too large

不要用太多的cache_control: ephemeral，服务器会返回520

GitHub Copilot auto 模型选择

copilot学生套餐现在每周都限额，就那么一点点用光就不让你自己选择模型了。但是Auto还是可以收到响应，只是它通常给你选的都是gpt-5-mini最烂的模型，用着很不爽。

Auto的工作逻辑如下

第一步：请求/models/session拿到sessionToken
第二步：带着Copilot-Session-Token:sessionToken发给/models/session/intent，根据用户提示词看看选哪个模型(他背后经常拿GPT-4旧模型来做一些对用户行为的预测)
第三步: 带着Copilot-Session-Token:sessionToken和第二步给出的建议模型发请求

 ---
  Auto 模式——3 次请求链路

  Conversation Start
  │
  ├─ 请求 1: AutoMode Token 获取
  │  POST https://api.individual.githubcopilot.com/models/session
  │  Headers:
  │    Authorization: Bearer {token}
  │    Content-Type: application/json
  │    X-GitHub-Api-Version: 2025-10-01
  │    Copilot-Integration-Id: vscode-chat
  │  Body: { "auto_mode": { "model_hints": ["auto"] } }
  │
  ├─ 请求 2: Router 决策（仅首轮+prompt变化时，1s 超时）
  │  POST https://api.individual.githubcopilot.com/models/session/intent
  │  Headers:
  │    Authorization: Bearer {token}
  │    Copilot-Session-Token: {session_token}
  │  Body: {
  │    "prompt": "用户输入",
  │    "available_models": [...],
  │    "turn_number": 1,
  │    "previous_model": null,
  │    "reference_count": 3,
  │    "prompt_char_count": 156
  │  }
  │
  └─ 请求 3: 实际聊天
     POST https://api.individual.githubcopilot.com/chat/completions  (ChatCompletions)
     或 POST https://api.individual.githubcopilot.com/responses       (Responses API)
     或 POST https://api.individual.githubcopilot.com/v1/messages     (Anthropic Messages)

  ---
  特定模型 (如 gpt-5-mini)——1 次请求链路

  Conversation Start
  │
  └─ 请求 1: 直接聊天 (无额外请求!)
     POST https://api.individual.githubcopilot.com/chat/completions
     或 POST https://api.individual.githubcopilot.com/responses
  ---

auto模式只能请求到这些模型：

“gpt-5-mini”,
“gpt-5.4-mini”,
“gpt-5.3-codex”,
“gpt-4o”,
“gpt-4.1”

auto模式之所以请求让你通过而不是429 user_weekly_rate_limited，原因就在于他多提供了一个http验证Copilot-Session-Token: {session_token}

知道这个之后，vibe coding魔改一下开源工作copilot-bridge(fork from copilot-api)，就可以把copilot模型接出来给Claude Code用了，而且可以用点gpt-5.3-codex而不是老是gpt-5-mini。

BYOK For Copilot

插件新开发了一版：

现在我们专门用来管理多个第三方api或公益站api。

通过模型管理器的添加模型选择BYOK提供商，或者ctrl+shift+p打开命令面板允许BYOK:添加站点，可以添加第三方站点信息，然后会从/v1/models自动获取可用模型，如果没有你要自己输入模型。

如果你提供了很多个第三方站点，他们都提供一个相同的模型，你可以和方便的通过模型旁边的设置切换(就是你如何切换模型思考effort，你就如何切换提供商)，比如AnyRoute和AgentRouter如果都有claude-opuis-4-7，你就可以鼠标悬浮在模型名字上等待配置显示，切换提供商。

目前autocopilot功能还有问题，开启autocopilot后模型返回为空不知道为什么。

写在最后

感觉东西不是很有价值，要开始赶作业了，也有点懒就没有把代码传到github。后续有时间再研究吧。。。

1 个帖子 - 1 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文

一些发现提供最近玩耍一个使用帖子

一些小的发现

deepseekv4逆向有感,还是差点意思

交友贴 或许会遇到同频的人吗

AnyRoute

GitHub Copilot auto 模型选择

BYOK For Copilot

写在最后

相关推荐

交友贴或许会遇到同频的人吗