做了两年 Agent,第一次有无力感

23 年 ChatGPT 爆火,那时 Agent 的概念还没出现,大家就开始疯狂套壳做 AI Chat。 紧接着,LangChain、LlamaIndex 等框架迅速冒头,跟着公司项目做各种 workflow 编排的 Agent。 后来 Claude Code 横空出世,花了半年时间逆向它的源码,开...
做了两年 Agent,第一次有无力感
做了两年 Agent,第一次有无力感

23 年 ChatGPT 爆火,那时 Agent 的概念还没出现,大家就开始疯狂套壳做 AI Chat。

紧接着,LangChain、LlamaIndex 等框架迅速冒头,跟着公司项目做各种 workflow 编排的 Agent

后来 Claude Code 横空出世,花了半年时间逆向它的源码,开始搞真正的 agentic agent。那段时间非常有趣:30% 是 LLM,70% 是工程,通过持续工程化,模型能力被一点点拉高。

26 年初,龙虾(OpenClaw) 的出现把 Agent 彻底推向顶峰,也让更多人真正看懂了什么是 Agent。

再往后,Claude Code 源码泄露,Agent 几乎再无秘密。

现在大家又转向 harness。我们写了大量约束和 guardrail,但 Agent 依然无法完美按照预期工作。

与此同时,Agent 本身也在快速进化:我们最近又开始研究更复杂的 workflow,而 Claude Code 自己也推出了官方 workflow 体系。

做了两年 Agent,第一次产生强烈的疲惫感、无力感和迷茫。模型越来越强,Agent 本身也在快速进化,可我们做的东西却反而越来越上层、越来越薄,像漂浮在半空中的脚手架。

从国内外局势来看,我们好像被悄然引导进了一个陷阱。Agent 和基础模型都在国外快速进化,而我们却在国内卷 skills、卷 harness、卷各种约束和工程细节。虽然也做出了一些成果,但真正带来的正向收益有限,反而让我们离真正的 Agent 和模型核心越来越远,数据飞轮也始终转不起来。

1 个帖子 - 1 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文