长期项目里的 Agent Harness,可能需要元认知自演化能力
长期项目里的 Agent Harness,可能需要元认知自演化能力 我感觉个人 Agent Harness 最缺的不是执行,而是自我迭代能力, 很多 Harness以及Agent框架,本质上还是偏执行环境,这个模式当然有用,但如果放到长期项目里,比如做代码项目、做产品原型、写论文
Harness - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 91 篇相关文章 · 第 1 / 5 页
长期项目里的 Agent Harness,可能需要元认知自演化能力 我感觉个人 Agent Harness 最缺的不是执行,而是自我迭代能力, 很多 Harness以及Agent框架,本质上还是偏执行环境,这个模式当然有用,但如果放到长期项目里,比如做代码项目、做产品原型、写论文
原生的居然不如 cursor,之前刷到有佬友提出过猜想:不同 harness 会不会带来不同的效果。刚好刷到了以上内容 1 个帖子 - 1 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺
回顾前文 Harness 工程的基本理解与Multi-Agent系统的区别 本人目前使用最频繁的模型,本篇博客接替上门继续讨论编程大模型: deepseek-v4-pro[max] sonnet 4.6[web] qwen3.6-plus glm-5 后两个模型为gc模型,不在本
别再用LangChain搭玩具了|工业级Agent引擎手写复刻 那些抄几行Python搭的智能体,一上生产就崩? 上下文雪崩|死循环烧Token|高危命令执行|记忆断电消失 这一次不调包,纯手写Agent底层引擎 从0到1撸一个工业级ReAct循环 干掉20+工程卡点:死循环拦截
以下都是正常提问,每次回答1500-2000字,不是编程 编程Antigravity的Harness比较拉胯,直接Claude Code或Codex不用犹豫 总价 pro尼区¥87,Antigravity家庭组¥150,5x尼区¥580 详见我这篇: 反重力这是怎么了 每个问题消
前篇 【长期贴】开个帖子,分享一下我自己是如何做harness【已更新完成,等待交作业,后续再有新想法再补充】 开发调优 据网上传,目前Anthropic的所有产品均为harness模式,不过最近他们推了一个harness产品,原本把我吓了一跳,但实质一看,并不是干货,多少有点恶
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。
之前在 V2EX 发过几次帖子分享我在开发开源项目 Chorus ,一个给 Claude Code 用的 Harness 时的 经验和教训 。简单说就是让 Agent 不只是写代码,而是自己管整个项目:领需求、出方案、拆任务、写代码、提交审查,从 Idea 到交付走完一条流水线。