各位佬友好,我是Jia,一名有着9年AI经验的00后,同时也是开源项目 Spice 的创始人,Spice 是我做的一款开源项目,一句话总结是 the decision layer above agent,即做 Agent 之上的决策层,最近在探索如何收取到更多不同维度的 context,通过不同入口的 context 来更好的展示 Spice 的价值。想拿出来讨论下,也欢迎大家一起来讨论与指正。
目前的 Agent 已经在数字世界大放异彩,无论在能力平权方面,还是生产力提升方面,这些发展验证了给 Agent 足够多的 context 他就有无限可能,未来 AI 公司的竞争也逐渐从技术能力转化到谁能拥有更多用户的 context,谁能维护更好的 state,以及做更好的自进化就会有更深的壁垒。
在这种发展下越来越多的人和公司意识到这一点,然后尝试做更多的 context 入口,收取更多的 context,比如越来越多的智能穿戴设备(眼镜,手表,项链,手环,耳机等等),甚至 OpenAI, Apple这样的大厂也开始做更多这样的尝试,从数字世界的 computer use 到物理世界的各种终端设备,通过不同维度不同类型的 context 从而让 AI 更好的深入我们的生活。
我们做 Spice 的时候为了找一个载体也想过这个问题,单拿硬件设备来说,目前所有终端设备都有不可替代性和弊端(眼镜最符合人类视角但功耗舒适度很难解决,手表可以采集部分健康数据但视觉数据不理想),那未来是否有一个终端可以采集一个人所有的context(脑机接口?隐形眼镜? and what?),我们也在做智能穿戴方面的尝试,比如pin…
从数字世界来说,computer use这个 part 做的人也越来越多了,openai 的 chronicle, air jelly等等,在 computer use 这方面发展的方向有很多,比如是预测用户下一个的 keystroke,或者预测用户一个小时后可能会做的事情,你可以通过 screen shot 的方式截屏收集 context,也可以通过绑定某个按键去识别数字世界的人类意图,这里能做的尝试也有很多,比如我们在尝试绑定 enter 键及 command tab等。
想问问佬友们为了实现更好的全域 context,有哪些更好的硬件及软件配合的方案及尝试,有更好的更全面的收集 context 的方式,实现 AGI 的方式一定是靠多个 Agent 网络,Spice 在尝试做这个多个 Agent 的控制层,未来越来越多的 Agent 会深入大家的生活,这将是很重要的一步,欢迎大家来一起讨论呀!
3 个帖子 - 2 位参与者