最近在搞自己的Agent记忆相关的项目,打算在此更新一下项目相关的日记。
本人前信奥选手,金融出身,摸鱼选手,以及完全不懂代码了。在用AI编程的时候,我的前提假设是,现在AI已经可以实现复杂工程了,只是可能需要通过增大系统摩擦,比如完善的工作流、工具链,比较重的review流程,和多方不同家AI的审查,当然,还有前期很重要的,完整的架构思想的建立,就可以保证项目的推进的完成。这样的代价是,要实现一个功能会先产出非常多的文本量,随后是非常重的review过程(为此我专门设计了一个skills,大概就是每完成一个task,就会先自行派两个不同视角的reviewer子智能体先去检查;每完成一个wave,又是两个;每完成一个phase,是四个,以及外部审查)这个就可以实现早上发一个消息,全自动运行一整天。非常利好摸鱼选手。(所以我codex pro 200刀的也不是很够我用)我自己的理解是,我把可能出现的问题,通过加大外部成本的方式,加大实现的时候的摩擦,从而提高运行质量。当然还有一些别的部分。
回到话题,那这些问题都可以解决的话,什么是最重要的?我觉得是你要做什么。比你能做什么更重要。
我自己在研究的AI记忆,切入点就是,我觉得现在AI核心缺乏的就是记忆能力。这个问题可以被化约为提示词问题,但是我觉得,把提示词换为注意力,那么对于人来说也是如此。失忆症患者,拥有注意力,但不享有记忆,不享有记忆不代表不能行事,其破坏的是人对连续性的感知。所以我觉得,记忆的概念对人来说,本身也不是完善的,人凭什么就能记住东西呢?人是自以为记住还是真实有记住呢?这个是“是什么的问题”。记忆是什么?
而对我来说,这一命题建立的基础就不能是稳定的(所以记忆非常非常重要的是,治理!不稳定,所以必须要纳入治理才行),意味着,记忆的来源,不能只是静态储存好的文本,也不能只是信息含义本身已经被折损的压缩语义,不只是嵌入向量,而且,记忆应该可以被改变。我的观念是,记忆本身就是幻觉,但又不只是幻觉。它是连续性的幻觉。
所以我设置的装置是关于对象和路径的装置,在这一系统中,我研究的是,“对象”是什么,“路径”是什么,以及这一装置构造的系统“是什么”。目前思考的最好的比喻是,我觉得对象就像是有不同面的沙石,你从不同角度去看它,它会展示不同的面貌。而沙石本身处在一个流淌的河流中,这意味着,沙石和沙石之间组成的扬起的那种类似结构的尘雾,是不稳定,又相对稳定的。而描述对象和路径关系的时候,其实就像是,寻路问题,在我已经找到一个点的时候,我如何快速找到下一个与之相关的点,我的想法是,我只需要把越为频繁使用和提及的点和点之间的路径,可以缩短和增长,也就是意味着,两个经常一块联想到一块的内容,会很容易的被一块想起来,而毫无关系的两个,并非不能联系到,而是需要经过漫长的路径折损才能到达。这意味着路径长短是可变的,同时又和对象这丰富的面相关。这也可以用势能去解释,就是记忆会从一个对象,自动的向势能最小的对象流去。所以连续性,表征的是河流本身,因为是在河流中,所以又必须具有可溯,可查的特质。对象不固定,可能会变化,会腐烂,会沉降。路径具有条件性,会缩短,会增长。而遗忘的特质,我觉得就是表征在路径上。
不知道我解释清楚了没有,我对AI记忆大体的想法目前是这样。这个项目已经搓了17w行代码了。后续再细说。我觉得大家都可以试一下搓个大点的项目,我已经重头再来3次了,蛮有意思的,我觉得现在AI编程慢慢真的变成管理决策问题了。而且失败其实也还好,就当给游戏充钱了 ![]()
2 个帖子 - 2 位参与者