前情提要
[image]
开源的威力开始显现,多项内容更新已经合并到官方仓库。(开源好啊,开源都是免费劳动力)
今天,我们发布了 Warp 社区最希望看到的更新之一:对推理过程的更多控制权。
开发者希望能够自行选择模型、使用自己的服务提供商账户、掌控推理成本,并且无需离开 Warp 平台即可尝试新的服务提供商。从今天开始,我们将进行两项改进,让 Warp 变得更加灵活:
-
BYOK 功能现在也适用于免费套餐用户。
-
Warp 现在支持与 OpenAI Chat Completions API 兼容的自定义推理端点。
现在,你可以使用自己的 OpenAI、Anthropic 或 Google API 密钥来为 Warp 的代理功能提供支持。或者,你也可以将 Warp 与兼容 OpenAI 的终端节点相连,比如 OpenRouter、LiteLLM、z.ai,或是你自己的内部处理系统。
为什么偏偏是现在?
我们最近将 Warp 客户端开源了,因为我们希望 Warp 能变得更加开放、可定制,同时也能更好地符合开发人员的实际使用习惯。让用户自行开发推理引擎来驱动 Warp Agent,也是这一目标的一部分。
在 Warp 中,使用 Warp Agent 依然是利用人工智能的最简单便捷的方式。该插件直接集成在 ADE 中,因此无需额外设置即可利用终端状态、代码库、规则、笔记本、工作流程、环境变量以及 MCP 服务器等资源。此外,Warp Agent 还能与 Warp 的代码审查、智能体管理功能以及 Oz 云平台完美配合使用。
同时,模型层应具备更高的灵活性。开发者应能够根据自己的需求,选择最适合的推理方式来使用 Warp Agent。目前,Warp 尚未原生支持某些特定的模型配置、自定义的路由规则、提供者设置、内部网关功能,也无法处理与模型提供者相关的现有协议和约定。
Warp 应能提供一套完整的智能体开发解决方案。开发者应能够自行选择相应的推理方式。
今天有哪些可用资源/服务呢?
BYOK 功能原本只在 Warp 的付费套餐中提供,现在我们也将其纳入了免费套餐中。免费用户可以为自己选择的合作伙伴添加 API 密钥,这些合作伙伴包括 OpenAI、Anthropic 和 Google。用户可以利用这些 API 密钥来提升 Warp 的智能体功能。在免费套餐中,使用 BYOK 功能需要登录账号,但个人用户可以免费使用该功能。
Warp 现在还支持与 OpenAI Chat Completions API 兼容的自定义推理端点。你可以利用这一功能,将 Warp 与模型路由器、网关、托管服务提供商、内部端点或自托管的推理系统相连接。
如果你有如下需求,自定义推理端点会非常有用:
-
Warp 目前还不支持直接使用该模型提供程序。
-
通过模型路由器或网关来处理请求路径。
-
尝试使用自己托管或自行搭建的推理系统来进行实验。
我们希望开发者和各个团队能以各种方式来利用这一工具。我们很期待看到人们会用它来创造出什么新的东西。
定价的运作方式
对于个人开发者和小型团队来说,在 Warp 平台上使用自带的 API 密钥或自定义推理端点是完全免费的。无论您使用的是 Free、Build 还是 Max 套餐,只要您使用的是自带的 API 密钥或兼容的推理端点,且该服务是为个人或人数不超过 10 人的公司所使用,Warp 都不会收取任何费用。
对许多开发者来说,Warp 提供的集成式推理功能仍然是最简单的选择。Warp 允许用户无需任何额外设置,即可使用 OpenAI、Anthropic 和 Google 等提供商的优质模型,以及各种顶级的开源模型。我们还负责与各模型提供商的沟通协调、确保模型的可用性、处理数据传输事宜,并保障数据隐私。由于 Warp 能从模型提供商那里获得批量采购折扣,因此使用 Warp 的积分来使用这些先进模型,是一种既方便又经济高效的方式,用户无需再分别管理各个提供商的账户、API 密钥、账单或端点配置。
BYOK 和自定义端点适用于那些希望掌控推理过程的开发者。他们可以自由尝试 Warp 目前还不支持的各类服务提供商和模型。而“打包式推理”则适合那些希望让 Warp 来处理模型访问和基础设施相关工作的开发者。
对于员工人数超过 10 人的公司而言,使用自带设备或自定义终端的方式,必须通过 Warp 的“Business”或“Enterprise”套餐来实现。规模较大的团队则将 Warp 的托管服务作为整个平台解决方案的一部分来使用:该平台还提供工具协调、上下文管理、团队使用情况监控、管理控制、治理机制、安全策略等功能,同时还能满足在整个组织内部署 AI 智能体的基础设施需求。
对于企业和商业客户而言,如果自行处理推理任务,将会消耗平台积分。这些积分是根据智能体在 Warp 的托管系统中实际运行所花费的时间来计算的,而非与模型推理本身相关的成本。由于客户自行提供模型、API 密钥或端点,因此使用这种方式时,所消耗的 Warp 积分远远低于 Warp 直接提供模型推理服务时的消耗量。
接下来要做什么呢?
从长远来看,开发人员和团队不会再只使用某一种模型、某个供应商或某一种工具。他们会根据具体的任务需求、成本、延迟、安全要求以及执行环境来选择合适的方案。Warp 应该能成为应对这种需求的最佳接口。
接下来,我们计划将一个轻量级的 Rust 客户端工具添加到我们的开源代码库中。这样一来,Warp 就能直接与本地模型进行连接,而无需经过 Warp 的服务器中转。我们还计划支持 Agent Client Protocol,这样开发者就可以将其他客户端工具集成到 Warp 的终端用户界面中。所有这些功能都将在客户端端实现,用户无需登录即可使用。
这与我们在将 Warp 客户端开源时所阐述的方针是一致的:我们希望 Warp 能更加开放、更具可定制性,其设计应符合开发人员的实际工作方式。同时,我们也要确保产品的完整性和可持续性。
首先,打开 Warp 软件,进入“设置”→“AI”选项,然后输入您的 API 密钥或配置自定义的推理端点。
请亲自试用一下,然后告诉我们:您希望 Warp 接下来能够支持哪些服务提供商、端点、本地模型设置以及智能体框架。我们非常期待您的反馈。
1 个帖子 - 1 位参与者