关于后训练的相关解读以及对于人工智能的一些思考

首先,把自己对AI的思考贴出来,方便和各位佬讨论讨论,附件是对论文 A Survey on Post-training of Large Language Models 的一些简要版的解读,方便大家快速了解。 后训练方法综述.pdf (2.6 MB) 首先就是,如何让模型训练走进寻常百姓家。目前的模...
关于后训练的相关解读以及对于人工智能的一些思考
关于后训练的相关解读以及对于人工智能的一些思考

首先,把自己对AI的思考贴出来,方便和各位佬讨论讨论,附件是对论文A Survey on Post-training of Large Language Models 的一些简要版的解读,方便大家快速了解。
后训练方法综述.pdf (2.6 MB)

首先就是,如何让模型训练走进寻常百姓家。目前的模型微调还是主要集中在那些大规模的大厂,需要极高的算力,那开源社区在做什么呢?在做skill,做harness工程,做tools,本质上是在为模型搭建身体。但是我们应该形成身体和灵魂的闭环,头脑为身体提供指示,反过来,身体的数据也应该反过来训练大脑

突然想起来,memory和模型的参数都类似于人类的大脑,但是推理能力让我们可以从不那么宽泛的知识来推导出更多的内容,但是memory更加类似于一个RAG的数据库,我们是否可以打通memory和参数之间的限制,让memory外挂,而让参数学会按需检索(包括去问其他的AI),类似于人类这样

接下来就是,对于不同的领域,我们对于模型的要求是不同的,比如创新领域我们需要模型更创新,但是有时候我们需要模型更保守,那么我们应该怎么让模型学会这个动态场景的自适应呢

我们也发现了,目前AI主要在代码和数学能力让突飞猛进,但是不知道你也没有想过这样的一个问题?
编程本身就是一个工具,你会软件开发只是说你掌握了编程这样的一个工具;同理,证明本身也是一个工具,是为了证明某个公理的合理性,你会做证明题只是说你掌握了数学证明这样的一个工具。那既然是工具,那就有被取代的可能。从此,软件开发变成了你使用AI编程这样的一个工具,数学证明变成了你使用AI证明这样的一个工具。所以AI的出现带来的是工具的迭代升级。
那么,我们转念一想,那AI绘画,AI视频,本质上不也是说将传统的工具进行了一次迭代吗?
所以,我们焦虑的到底是什么?我们为什么不能放心的去拥抱新的工具?
工业革命,缝纫机的出现,不就是把人类的用手缝缝补补变成了用机器缝缝补补,效率得到了提升;如今,AI的出现,把传统的古法编程变成了用AI编程这样的高效工具。
我们羡慕那些不被AI取代的领域,可是AI并非取代,AI的作用更在于带来了部分领域效率的倍增。所以,具身智能出现了,也许未来,对于搬砖这样的技能,也许机器人可以做的更好,成本更低。那这些人何去何从也许是一个值得思考的问题。
所以,我们学的是什么?传统的课程还有没有学习的必要?
有的,所谓学历史是为了用好历史,对于非信息领域,适应工具的发展,大大提高你的效率。对于信息领域,或者说对于像我一样,在AI的前沿领域探索的人来讲,我们需要知道计算机领域的发展,包括但不限于,我们为什么从单周期CPU前往了流水线CPU,我们为什么选择机制和策略相分离,我们为什么要选择层次化的设计。这将是历史的智慧,尤其是对于AI这样的新领域,一点点的历史的启发也许会带来效率的倍增。有了这些智慧,无论是训练AI,亦或者是开发Harness,其实都是在为大家开发更加高效的AI工具(比如搜素的更加高效,召回率更高)来供大家使用。

何为高效?比如搜索,你更愿意花费30s来等AI的综合搜索,还是更愿意自己用浏览器搜索。二者都是工具,如何选取,需要根据场景的不同动态的选择

但其实这一切都基于AI不会产生灵智,即他只是一种更高效的工具。比如AI不会在你没有给指令的时候完成你的COD实验,也不会在梦中突然产生灵感然后自己开始干。在这一过程中,灵感越来越重要,你的idea越新颖,你对于AI工具的使用就越惊艳。
所以,AI不能取代什么?也许只有灵感的诞生。也许你会说AI可以辅助你产生灵感,但是AI自己是没有灵感的。
如果有一天,AI有了灵感,那人类危…

4 个帖子 - 3 位参与者

阅读完整话题

来源: linux.do查看原文