鼓捣sub2api引发的思考

跑注册机的时候,谁会去翻账号设置里的隐私选项? 今天古法注册了一个账号,发现 “ 数据共享 ” 开关果然是默认打开的。 然后我突然想通了一件事:我们天天害怕中转站泄露数据,但其实 平台根本不需要靠买中转站来买数据 。只要把账号数据共享默认打开,平台自己等着无数用注册机批量注册的账号,自动把所有对话数...
鼓捣sub2api引发的思考
鼓捣sub2api引发的思考

跑注册机的时候,谁会去翻账号设置里的隐私选项? :distorted_face:
今天古法注册了一个账号,发现 “数据共享” 开关果然是默认打开的。

image
然后我突然想通了一件事:我们天天害怕中转站泄露数据,但其实平台根本不需要靠买中转站来买数据。只要把账号数据共享默认打开,平台自己等着无数用注册机批量注册的账号,自动把所有对话数据上传共享就行了。然后人工(我就干过这个兼职,真黑)和其他方法做筛选,拿来训练模型。 :face_with_monocle:

所以我放一个暴论:之前平台是不是故意对注册机放水?因为注册机产生的海量对话数据,就是他们训练和蒸馏模型需要语料

私货:

剧透

6 个帖子 - 3 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文