楼主近几日在折腾 hermes 驱动编码。发现通过 IM 通道操纵 agent 这条路基本上是可以应用在小微场景下的了,犹如前两年的补全场景向小功能的 agent 编码的阶段。
目前完全是可以做到通过 IM 进行:语音输入指挥+远程可视化查阅(agent 桌面截图,发日志,内网穿透部署 web 进行功能测试,agent 通过 IM 进行语音播报)。
至于程度多少,则取决于模型智能程度以及 skills 等的调教程度。以及后续模型侧,工具侧,操作系统侧,agent 侧的迭代进步。
所以这个时候,码农的生产力工具需求就从各种工位上的高分屏带鱼屏之类的变成了:一个便携的“大屏”————移动指挥中心。不用坐在固定的工位盯着显示器大屏,随时随地掏出折叠屏展开查验 agent 的工作产出。
而折叠屏就是“便携”和“大屏”的一个折中方案。
当然了,这里还有一个逻辑点就是为什么要”移动”,做在大屏幕前不好吗,当然好。
但是能够自由移动且不耽误工作进度总归算是一种便利上的进步,把码农从工位大屏前解放出来,可以自由移动。(仅限数字游民等自由职业者)。