Hermes 在进化 Agent,但“该做什么”谁来决定?Spice + Hermes(via SDEP) 的一次尝试

Hermes + Spice来了!各位佬友久等了! 最近有一个很明显的趋势是:Agent的执行能力在快速进化 从 Openclaw 到 Hermes,任务执行质量在不断提升,尤其是Hermes的Agent evolution能力。 与此同时有一个问题也越来越明显: 我们都在解决“怎么做”,但“该做什...
Hermes 在进化 Agent,但“该做什么”谁来决定?Spice + Hermes(via SDEP) 的一次尝试
Hermes 在进化 Agent,但“该做什么”谁来决定?Spice + Hermes(via SDEP) 的一次尝试

IMG0162

Hermes + Spice来了!各位佬友久等了!

最近有一个很明显的趋势是:Agent的执行能力在快速进化

从 Openclaw 到 Hermes,任务执行质量在不断提升,尤其是Hermes的Agent evolution能力。

与此同时有一个问题也越来越明显:

我们都在解决“怎么做”,但“该做什么”,还没有真正被解决。

1. 关于“决策解耦”的大胆尝试

我们做了一次大胆的尝试:Spice + Hermes(via SDEP)。

现在大多数的Agent设计或方法论,其实都有一个共同点:“决策”和“执行”是耦合在一起的。

比如ReAct:它把 reasoning 和 acting 放在同一个 loop 里。

它很强,但“该做什么”和“怎么做”,没有清晰的边界。

也就是说:决策是隐式的,执行是耦合的,结果也很难结构化回流。

所以我们做了一件很简单的事情:把 ReAct 里的 Act,抽成一个独立的协议边界

让“该做什么” → 由一个独立的决策层产生,把“怎么做” → 交给不同的 agent 去执行,他们中间通过一个明确的协议连接:SDEP

这就是我们做Spice + SDEP的出发点(:waving_hand:把“执行”与“决策”彻底解耦)

Generated Image April 20, 2026 - 644PM

2. Hermes 控制执行进化,Spice 控制决策进化

这次Spice + Hermes尝试的核心不是“再做一个 Agent”,而是把 Agent 系统里常常混在一起的两件事拆开:

  • Hermes继续进化执行能力:入口、tools、skills、execution

  • Spice专注进化决策质量:state、simulation、权重、约束、取舍

  • SDEP作为中间的协议边界:把决策变成结构化执行请求,再把执行结果结构化回流

简单点来说:

  • Hermes 负责把事情做得更好。

  • Spice 负责判断什么事值得做、什么时候做、为什么做。

  • SDEP 负责让这两层不要混在同一个 Agent loop 里。

Hermes controls Agent Evolution, and Spice controls Decision Evolution.

3. 从黑盒 Loop 到透明逻辑结构

:open_book:举个简单的例子:

当系统收到一个任务:处理这个 GitHub PR

在普通 Agent loop 里,这通常会变成一个连续过程:Agent 理解任务 → 自己判断要怎么做 → 调工具执行 → 总结结果

决策和执行发生在同一个黑盒 loop 里。

它到底是怎么决定:

  • 现在处理?
  • 先 triage?
  • 直接修改代码?
  • 还是先问用户确认?

这些判断通常藏在 prompt、上下文和 agent 自己的 reasoning 里。

而在 Spice + Hermes 里:

Spice先根据当前状态决定现在最合理的行动是什么,Hermes 只负责:把这个行动执行到最好,中间通过 SDEP,把决策变成结构化请求,执行结果再回流,影响下一次决策。

这次我们把 Spice 和 Hermes 做了一次真实组合。把“决策”和“执行”,变成两个独立的层。

在这个组合里:

  • Hermes负责接收外部消息、连接工具、调用执行层 Agent

  • Spice负责维护决策所需的 state,构建当前 decision context,模拟候选行动,并做最终 recommendation

  • SDEP负责把 Spice 的 recommendation 转成结构化执行请求,并把执行结果以 structured outcome 回流给 Spice,用于 decision evolution。Hermes 则保留执行过程、工具调用和 transcript,用于自己的 agent / execution evolution。

Generated Image April 20, 2026 - 646PM

4. Same Brain, Different Agent

:warning:但这里有一点很重要:Spice 并不绑定 Hermes

Hermes 只是这次的一个 reference executor。

只要一个 Agent 能理解 SDEP,或者能通过 wrapper 被转成 SDEP,Spice 就可以把决策交给它执行。

也就是说,未来接入的可以是:OpenClaw,Claude Code,Codex以及未来的physical-world agent。

Spice 保持在 decision layer,外部 Agent 保持在 execution layer。

SDEP 则是它们之间的协议边界。

5. Spice 与它的 SDEP 标准

:red_exclamation_mark:这件事重要的地方,不是我们把 WhatsApp、Hermes、Codex 接在了一起。

而是我们可能一直在优化 Agent 的“手”,

但忽略了它的“脑”。

执行层可以继续变得更强, 更快、更自动化、更通用,而决策层, 可以开始被单独建模、优化、甚至演化,这也是我们想推动 Spice和SDEP 的原因。

为什么推动Spice:

Agent 的执行能力正在快速进化,但“决策层”还没有真正独立出来。

现在大家都在让 Agent 更会做事:

  • 更强的 tools

  • 更长的 context

  • 更好的 coding / browser / automation

但真正关键的问题是:

谁来决定现在该做什么?为什么做?执行结果如何影响下一次决策?

Spice 想做的不是另一个 execution agent,而是 agents 之上的 decision runtime。

它关注的是 state、simulation、preference、constraint、trade-off 和 decision evolution。
未来 AI 系统不只需要更强的执行能力,也需要一个更清晰的决策层。

为什么推动SDEP:

如果每个 execution agent 都有自己的调用方式、自己的返回格式、自己的失败语义,那么 decision runtime 很难真正变成一个独立层。

SDEP想做的事情很简单:

  • 标准化 execute.request

  • 标准化 execute.response

  • 区分 protocol failure 和 task failure

  • 让 outcome 可以被 decision layer 消化

  • 让不同 execution agents 可以被替换

它不是为了替代 ReAct 或 RL。 它是为了给 decision layer 和 execution layer 之间留出一个清晰边界。

7. 欢迎来到 Spice 社区

这次我们已经把这套想法做成了一个可以跑的 reference integration。

目前 repo 里已经包含:

  • decision.md:用户可编辑的决策配置

  • examples/decision_hub_demo/:Spice-Hermes 组合中的demo domain

  • spice-hermes-bridge/:Spice接Hermes的参考桥接

  • schemas/sdep/v0.1/:SDEP JSON Schemas

  • examples/sdep_payloads/v0.1/:SDEP request / response 示例

  • examples/sdep_quickstart/:给 executor 作者的 SDEP quickstart

如果你想体验Spice + Hermes或把Spice接入不同domain,具体怎么运行、怎么接入、怎么实现 SDEP executor,可以直接看 GitHub README 和 repo 里的 quickstart。

如果你也觉得未来 Agent 系统不应该只继续堆 tools、堆 memory、堆 execution loop,而是需要一个更清晰的 decision layer,:glowing_star:欢迎 star / issue / PR,也欢迎评论区讨论!

7 个帖子 - 2 位参与者

阅读完整话题

来源: linux.do查看原文