测试agent:Claude code & reasonix
测试预设: Auto & Pro only
编程语言:lua
实现要求:绘制脚本菜单、图形,与游戏场景下的part资源进行调控,开发一个地板上的经验被磁吸到玩家角色后吸收
指导:纯 vibe coding
结果:失败
有感:使用auto的时候花费较少,编程能力无明显亮点;使用Pro only的时候花费提升3倍以上,编程能力略小幅提高。第一轮编辑:模型提供了开发前提清单,经过核对后确认功能可以实现,模型自己进行第一轮开发。
deepseek模型的上下文能力有待继续观察,已经指定工作path却还是选择在桌面同步更新,不知道为什么。
第二到四轮,有多次最基础格式规范问题导致的运行不成功,不会使用控制台输出日志,强硬选择直接在画面叠加层显示,第二至三轮均运行后卡死,因为deepseek没有考虑并发工具栈承受能力,至此已经花费2元。
第五到六轮,位置复写失败,部分事件在给出的教程明确写明不支持的情况依旧尝试,出错后仍然坚持错误开发路线,强行纠正后报告无法开发,试验结束。
个人认为唯一的优点就是不会触发道德约束,能够进行网络(发包、收包、劫持等)操作,不支持image识别,现在所有tui都有点问题,感觉乱糟糟的
6 个帖子 - 3 位参与者