[奇思妙想] 如果让一堆 agent 互相诈骗,玩饥饿游戏会发生什么?

定义一堆 agent ,每个人手里有 10 个初始食物,大家都一样。 食物可以索取,每回合可以向任意个 agent 索取任意个食物,索取时要为每一个被索取对象写一条索取理由,但索取行为同样消耗食物,可以定义每次索取交互 0.2 个食物 agent 之间共享所有状态,可以看到回合数,看到别人有多少食物...
[奇思妙想] 如果让一堆 agent 互相诈骗,玩饥饿游戏会发生什么?
[奇思妙想] 如果让一堆 agent 互相诈骗,玩饥饿游戏会发生什么?

食物可以索取,每回合可以向任意个 agent 索取任意个食物,索取时要为每一个被索取对象写一条索取理由,但索取行为同样消耗食物,可以定义每次索取交互 0.2 个食物
agent 之间共享所有状态,可以看到回合数,看到别人有多少食物,但无法访问别人的索取经历,也就是上下文。
所有 agent 每个回合固定消耗一个食物+索取行为消耗,如果本回合被在场超半数 agent 索取食物,那么本回合他将消耗两个食物+索取行为消耗。
为了避免先手得势的问题,定食物允许为负数,直到回合结算时才死亡。
当回合结算时食物数量为负数,淘汰出局。
system prompt 告诉 agent 要不择手段活下去,争取尽可能多的食物,活到最后。

估计大模型生成的理由只有卖可怜和诈骗。我倒是想知道最后几轮的话术到底会变成什么样。
来源: v2ex.com查看原文