跑注册机的时候,谁会去翻账号设置里的隐私选项? ![]()
今天古法注册了一个账号,发现 “数据共享” 开关果然是默认打开的。

然后我突然想通了一件事:我们天天害怕中转站泄露数据,但其实平台根本不需要靠买中转站来买数据。只要把账号数据共享默认打开,平台自己等着无数用注册机批量注册的账号,自动把所有对话数据上传共享就行了。然后人工(我就干过这个兼职,真黑)和其他方法做筛选,拿来训练模型。
所以我放一个暴论:之前平台是不是故意对注册机放水?因为注册机产生的海量对话数据,就是他们训练和蒸馏模型需要语料?
私货:
剧透6 个帖子 - 3 位参与者