一周以来就是测试+测试+测试–>bug+bug+bug (其实侧面说来要把一个更学术性的东西转换成实用性的东西并不简单),这几天也见证了Hermes agent在社交媒体上兴起,见证了它和open claw的种种对比,其实我当时看到Hermes agent的时候是四五天前,但是实际上它在开源社区火起来已经是两个月前了,当时我看到它提出来自进化的时候我以为全完了,感觉得不错的一个work就要沉于大海了
但是转念一想不太对,我的idea应该和它还差挺多的,毕竟EVO的概念火起来也没多久,从ICLR几篇还不错的EVO方向的paper也可以看出来,其实大家在这个方向也没有起步很久,那么我们先来康康Hermes和OpenClaw如何设计的?
【Hermes agent】:让 agent 记住东西+让 agent 慢慢把这些经验变成自己的习惯和能力 (核心问题:这些能力你真的想要吗,这些能力是否都是安全的,能力是否能真正复用,是否需要停止不必要的进化,只进化skill真的够吗??)
【OpenClaw】:让 agent 长出更多能力 +让这些能力更容易被装上、复用、扩展(核心问题:是否长出的能力是长期可行的,是否满足用户需求,是否能在安全环境下可复用(openclaw的权限问题一直是大家关心的,那么万一进化出高权限但是错误的能力会造成什么后果!),以及部分Hermes agent的问题等等!)
【EVO Harness】: 长期状态沉淀+帮系统管理成长+【harness约束的安全性!】
大家可能会觉得上面的概念有点抽象,可以先看一下我的图片中英文均有->我设计的专门针对自进化的workflow【其他简单harness的设计就不拿出来说了,毕竟也都不可能有Claude code做得好】
至于为什么要现在开源,因为其实大家等了挺久了,私信也在催了hhh,但是实际上我还是有几个测试用例没有很好的通过,有时候因为权限和环境落实不了真实工具,而且我感觉这个让科研到实用的落地路上大家也都可以帮帮忙!我感觉这个work的创意性和作用还是很大的,大家感兴趣也可以支持一下,大家感兴趣也可以star一下【iLearn-Lab/EvoHarness】感谢支持,也欢迎大家关注我们的开源社区【iLearn-Lab】
由于是第一次发稿,可能有些地方没写好,希望大家包容一下,也可以给出些建议方便调整GitHub - iLearn-Lab/EvoHarness: EvoHarness delivers terminal-native agent infrastructure: tools, commands, skills, agents, plugins, MCP, memory, approvals, and controlled self-evolution · GitHub
5 个帖子 - 3 位参与者