「转载」谁在 GPT-5.5 脑子里塞了一群「妖怪」?|从gpt的哥布林事件看对齐危机

从 openai: 为什么我们的模型喜欢上了哥布林 | 奇怪的黑话 继续讨论: 省流: 内部训练gpt的时候,给他设定了人格,比如「书呆子」(Nerdy) 此类人格非常容易使用生物词汇 随着不断迭代,就变成了如今这个样子 我倒是没见过() 因为是英文用户专属() 文源APPso 截掉了部分无关紧要的...
「转载」谁在 GPT-5.5 脑子里塞了一群「妖怪」?|从gpt的哥布林事件看对齐危机
「转载」谁在 GPT-5.5 脑子里塞了一群「妖怪」?|从gpt的哥布林事件看对齐危机

openai: 为什么我们的模型喜欢上了哥布林 | 奇怪的黑话继续讨论:
省流:
内部训练gpt的时候,给他设定了人格,比如「书呆子」(Nerdy)
此类人格非常容易使用生物词汇
随着不断迭代,就变成了如今这个样子
我倒是没见过()

因为是英文用户专属()

文源APPso
截掉了部分无关紧要的内容() 过程中也分享一点自己的内容

Screenshot20260430193549
Screenshot20260430193602
https://openai.com/index/where-the-goblins-came-from
Screenshot20260430193711
Screenshot20260430194038
不过中文用户好像并没有这种人格:
Screenshot20260430193930
除非是那个天马行空
Screenshot20260430194647
mmexport1777549620389
原来现在选什么都没用了()
Screenshot20260430194753
哥布林万岁≧▽≦! :melting_face:
file0000000099cc7209933adf044e9f3311

顺便写了个小说

ChatGPT

ChatGPT - 哥布林大合影

Shared by 星缘 via ChatGPT

还是蛮有意思的

7 个帖子 - 5 位参与者

阅读完整话题

来源: linux.do查看原文