[AI Agent 智能体] 越来越怀疑,很多 Agent 现在根本进不了企业

最近这段时间,我一直在做 Agent Runtime 。 然后越做越发现一个问题。 现在很多 Agent Demo ,看起来真的很猛。 会规划。 会调用 Tool 。 会 MCP 。 会 Multi-Agent 。 还能自己拆任务。 但问题是。 这些东西很多时候只适合 Demo 。 一旦真的开始接企...
[AI Agent 智能体] 越来越怀疑,很多 Agent 现在根本进不了企业
[AI Agent 智能体] 越来越怀疑,很多 Agent 现在根本进不了企业

最近这段时间,我一直在做 Agent Runtime 。

然后越做越发现一个问题。

现在很多 Agent Demo ,看起来真的很猛。

会规划。 会调用 Tool 。 会 MCP 。 会 Multi-Agent 。 还能自己拆任务。

但问题是。

这些东西很多时候只适合 Demo 。

一旦真的开始接企业里的系统,问题马上就开始出现。

比如:

一个长任务执行 20 分钟之后,上下文乱了怎么办?

多个 Agent 同时修改状态,memory 冲突怎么办?

AI 调错 Tool 了怎么办?

任务执行到一半挂了,怎么恢复?

企业里的权限怎么隔离?

出了问题之后,怎么审计?

这些问题其实都不是 Prompt 能解决的。

甚至很多都已经不是“大模型问题”。

而是 Runtime 问题。

我现在越来越觉得,现在很多人其实高估了 Agent 的“智能”,但低估了 Agent 真正进入生产环境的难度。

因为 AI 一旦开始真正“做事”,而不是聊天,它碰到的问题会越来越像:

  • 分布式系统
  • 状态机
  • 调度系统
  • 工作流引擎
  • 权限系统

而不是 Prompt Engineering 。

所以我最近在做的东西,核心已经不是“怎么让 Agent 更聪明”。

反而是:

怎么让 Agent 不失控。

现在我的思路有点像:

Runtime 负责管理。

Agent 负责干活。

用户请求进来之后,Runtime 先做路由,再把任务交给不同领域的“数字员工”。

每个员工只负责自己领域内的事情。

然后 Runtime 去解决:

  • 权限
  • memory
  • 调度
  • sandbox
  • 状态恢复
  • 多 Agent 协同
  • Human-in-the-loop

这些问题。

我现在甚至有一种感觉。

未来企业真正需要的,可能根本不是一个“超级 Agent”。

而是一套稳定的数字员工系统。

而真正难的部分,也不是模型。

而是 Runtime 。

来源: v2ex查看原文