一个疯狂的想法:用本体论抽象一个现实

背景。 我认为,大语言模型从 gpt3 开始( 2020 年 6 月)到今天,虽然已经有了 5-6 年时间,但仍然处于这项技术的发展初期,大语言模型本身还有很多可以改进的地方(这块我不是很懂,我觉得如何用更少的资源实现更强的能力应该是一个很重要的方面,特别是如何在 cpu 上也能运行能力强大的模型。...
一个疯狂的想法:用本体论抽象一个现实
一个疯狂的想法:用本体论抽象一个现实

背景。

我认为,大语言模型从 gpt3 开始( 2020 年 6 月)到今天,虽然已经有了 5-6 年时间,但仍然处于这项技术的发展初期,大语言模型本身还有很多可以改进的地方(这块我不是很懂,我觉得如何用更少的资源实现更强的能力应该是一个很重要的方面,特别是如何在 cpu 上也能运行能力强大的模型。),但是,最关键的是我认为,大语言模型的工程化还在非常早的初期,很多问题还有待解决,特别是大模型的幻觉问题,直接限制了大模型在实际业务中的应用。

我认为,从开始我们直接用语言和大模型进行沟通,也就是所谓的“提示词工程”可能就是一个错误。

大模型的本质,就是以语言为计算因子的一种数学计算过程。大模型的所谓幻觉、对齐问题,不是大模型本身的问题,而是我们使用大模型的方式不对。

我们现在发几个字符,就希望大模型实现一个准确、高质量的回复;或者发一堆字符,希望大模型都能理解、记忆。这种用文字直接让大模型生成结果的做法我认为是错误的方式。

本体论

我认为,正确的方式是,应该在大模型和人之间建立一个层,这个层是一个由人类建立的符合现实的语义空间,对话语义经过这个转换层,就能确保大模型参与计算的所有因子都是真实可信的。

那么,如何建立这个层呢?我认为,就是将本体论( ontology )引入 agent 。现在也有很多人在做这方面的工作,但问题是他们都只是将一个很小知识领域本体化,每个人都需要建立自己的领域本体论,这也是为什么 Palantir 公司的成本这么高。

** 疯狂的想法: ** 我们可以花费几万亿去计算一个模型,为什么不能花一点小钱,将整个现实世界通过语言抽象到一个本体论的知识图谱空间中?

总结

人工智能领域一直有三大流派:符号主义、连接主义和行为主义。 open ai 的 chatgpt 告诉我们,连接主义正确的打开方式,就是用扩大规模。 那么,符号主义、行为主义的问题是不是也是因为规模不够大?

如果我们用力大飞砖的方式,把符号主义、行为主义的技术规模扩大是否也会产生质的变化?

最后,我们为什么不将符号主义(本体论)、连接主义(大模型)和行为主义(强化学习)的技术为什么不同用 agent 链接起来?这可能才是人工智能真正的打开方式。

来源: V2EX - 技术查看原文