关于 MCP 接入与 Token 消耗的疑问

最近针对MCP和SKILLS接入时候有了对于TOKEN消耗的担忧啊. 以 Google 的 chrome-dev-tools-mcp 为例,这个 Server 里面自带了 40 多个工具。我想请教一下各位佬关于 MCP 底层调用机制和资源分配的问题: MCP 的底层注入机制 当我装好一个包含海量工具...
关于 MCP 接入与 Token 消耗的疑问
关于 MCP 接入与 Token 消耗的疑问

最近针对MCP和SKILLS接入时候有了对于TOKEN消耗的担忧啊.

以 Google 的 chrome-dev-tools-mcp 为例,这个 Server 里面自带了 40 多个工具。我想请教一下各位佬关于 MCP 底层调用机制和资源分配的问题:

  1. MCP 的底层注入机制 当我装好一个包含海量工具的 MCP Server 时,Claude 究竟是如何调用它们的?是系统会在每一次对话(Turn)中,都把这 40 多个工具的 Schema、描述(Description)和入参参数完整地硬塞进它自己的 Prompt 里吗?如果是这样,这部分隐形的 Token 消耗大概会占多大比例?
  2. 工具膨胀与 Token 消耗的矛盾管理 随着系统能力的扩展,接入的 Skills 和 MCP 越来越多。大家在实际工程中,有什么好办法来平衡“日益丰富的工具集”与“暴涨的上下文 Token 消耗”之间的矛盾?
  • 是倾向于在客户端做静态白名单(只开放部分工具)?
  • 还是通过类似 RAG 的方式做工具的动态路由和按需加载?
  • 或者主要是靠拉满 Prompt Caching(提示词缓存)来硬抗成本?

感谢各位佬解答!

2 个帖子 - 2 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文