关于现阶段 LLM 能力的边界

非 AI 从业者,大概是从 ChatGPT 出现开始深度使用 LLM 和各类编码 agent。 一个能力不足的人去做一件难度不匹配的事情,更有可能什么成果都做不出来。但 LLM 就不太一样,你提了严格的要求和硬性的验收标准,它总能交出一份成果并声称所有标准都达到了,等你一看才知道全是走捷径来的。实际...
关于现阶段 LLM 能力的边界
关于现阶段 LLM 能力的边界

非 AI 从业者,大概是从 ChatGPT 出现开始深度使用 LLM 和各类编码 agent。

一个能力不足的人去做一件难度不匹配的事情,更有可能什么成果都做不出来。但 LLM 就不太一样,你提了严格的要求和硬性的验收标准,它总能交出一份成果并声称所有标准都达到了,等你一看才知道全是走捷径来的。实际上如果每一步都监督的话基本上就得一直打断,连第一步都走不出去。但是仅凭 agent 本身的 self-discipline 就做不到。

现在最大的体会只能说是,用 LLM 挑战超出能力边界的事情就是自不量力,费钱费力。我最费解的或许是它能力边界之内最有价值的应用到底是什么。

1 个帖子 - 1 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文