背景是这样的:我们训练及开发了很多AI目标检测的能力,比如使用摄像头识别区域行人、识别是否抽烟、识别是否起火、温度感应自动喷水、湿度高自动开启空调抽湿、室内夜晚时间识别到有人自动开灯等等。总之就是很多AI的场景案例。
现在有个需求,不知道怎么设计才能落地,主要是搭建出模拟演示场景。
大概的需求是:我们先搭建一个展示系统,上面就以调用API的形式,调用各种AI场景的功能,形成一个一个的小场景。
接下来,想要实现,大概就是让用户在本页面上通过一个对话框,他可以自己写一段场景描述,比如:”放假了,我现在想要在办公室区域开启行人检测、起火防范、过热开空调的功能。“,
然后通过 XXX 设计(实现智能体?Agent框架?工作流?目前不清楚),就能够自动去找到对应的功能包?Skill?总之就是把这些像积木一样的AI能力,聚会起来,然后自动组成一个新的综合性的演示场景。
最后,输出给用户的就是一个包含了他说的这几种能力的一个综合的演示场景页面,出现一个模拟效果。
大概就是这个意思。那么现在问题来了,目前没有思路,想问问技术佬友们,这种需求下,如果是你们,怎么设计?怎么计划实现?需要哪些技术栈?
目前我想到的是,把这些AI能力功能,都先做成Skill技能,然后通过openclaw 再理解用户自然语言意图后,把匹配到的skills又组合成一个新的skills,但是这没办法在系统页面上模拟出来啊,最终用户看不到这个演示效果啊?
求助,求助,高手们快来指点一二…
1 个帖子 - 1 位参与者