gemini3.5flash这个安全对齐蛆完了

gemini-3.5-flash这个安全对齐在搞什么呀?还有反蒸馏的内置系统提示词让模型不输出正常思考过程,我通过压力提示词让它尽力输出的更好更长的代码的提示词还让他识别成越狱了,导致一大串的要求相当于直接失效,并且明显的降低了模型的能力,模型也相当于没有思考,就直接进行了输出,因为这个问题模型没有...
gemini3.5flash这个安全对齐蛆完了
gemini3.5flash这个安全对齐蛆完了

gemini-3.5-flash这个安全对齐在搞什么呀?还有反蒸馏的内置系统提示词让模型不输出正常思考过程,我通过压力提示词让它尽力输出的更好更长的代码的提示词还让他识别成越狱了,导致一大串的要求相当于直接失效,并且明显的降低了模型的能力,模型也相当于没有思考,就直接进行了输出,因为这个问题模型没有按照用户的指示进行,而是直接与用户的提示词进行了一个对抗,这真的是太糟糕了,我真的不知道谷歌他们在搞什么?

IMG7741
IMG7742
翻译:
IMG7739
IMG7740

4 个帖子 - 3 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文