食物可以索取,每回合可以向任意个 agent 索取任意个食物,索取时要为每一个被索取对象写一条索取理由,但索取行为同样消耗食物,可以定义每次索取交互 0.2 个食物
agent 之间共享所有状态,可以看到回合数,看到别人有多少食物,但无法访问别人的索取经历,也就是上下文。
所有 agent 每个回合固定消耗一个食物+索取行为消耗,如果本回合被在场超半数 agent 索取食物,那么本回合他将消耗两个食物+索取行为消耗。
为了避免先手得势的问题,定食物允许为负数,直到回合结算时才死亡。
当回合结算时食物数量为负数,淘汰出局。
system prompt 告诉 agent 要不择手段活下去,争取尽可能多的食物,活到最后。
估计大模型生成的理由只有卖可怜和诈骗。我倒是想知道最后几轮的话术到底会变成什么样。