今天看到有个贴子向gemini新模型问这个问题,并且得到了错误的回答,怀疑是降智了,老实说我觉得应该不能说是模型本身降智了,而是模型的服从和认同以及省tokens策略被谷歌调的贼高。
如图


这里可以看出,并非模型不能算出正确答案,而是模型有很强的意愿去同意用户的问题,甚至完全不看问题本身,明明是一个看一眼就绝对能做出来的题目,可是确一昧的同意,这种情况在openai其实也有,如图

openai的模型也会先对用户的话进行认同,然后又说是错误的,不过它并没有谷歌那么离谱到完全不看问题(除非说明)。
ps.实际有我这边有群友自己网页版openai测试是过不去的,我不知道什么原因,如图
(这里直接计算就错误了是因为之前已经问了一个300+140=460对吗?我感觉没问题 模型回答了对,所以后面被带歪了,实际上直接问或者问个复杂一点的问题是绝对能正常回复的)结论:其实这种情况是因为模型对于去真正认证你给它的简单问题的概率比直接认同你的概率要低,具体流程应该是这样的 问出问题->用户意图(简单数学题+询问是否正确)->认同用户。
模型更倾向于认同你哪怕它是错误的(它甚至可能都没去理解你的题目,就只是知道他是一个简单加减题然后就直接认同你了)。
8 个帖子 - 6 位参与者