小龙虾用了快三个月了,在这中间我深刻感受到了这个东西就是个玩具,根本当不了生产工具,就算轻量型任务,就算是用顶级模型,稳定性和正规军的agent比起来也远远不如。
最令人难受的就是频繁的健忘,升级后,或者开了new session后经常就忘了之前定好的规矩了。
定好的每日总结发送新闻的任务,反反复复的坏,每次升级后都坏,让它修好了,下次升级又坏了。就这么个简单的任务,修了四五次,最近一次升级后又罢工了,我也懒得修了。
最近一次升级后还出现了莫名其妙的读图bug,给他发一张图,他莫名其妙地读到了之前的session的图,也不知道这个session隔离是怎么做的。
Codex出了手机版可以remote之后,我尝试直接用手机版Codex ssh连接到vps上部署的Codex cli,如丝般顺滑,执行精准,除了不能在电报里用之外,我觉得体验比小龙虾已经好太多了。至于memory什么的,其实用本地md或者notion数据库一样能实现。整体体验是相当可以的。我决定后面就切换到Codex了,不妨叫它大龙虾 ![]()
1 个帖子 - 1 位参与者