我最近开发了一个运维 agent ,我想让大家体验和使用下效果怎么样。
这个是智能核心
https://github.com/mumong/aiops-pod
这个是工具 mcp
https://github.com/mumong/mcpServer-holmesgpt
这个是可观测性的部署。里面包含了上面要用到的 prometheus 工具
https://github.com/mumong/Observility
使用方式为,将上面 2 个资源拉下来 然后部署到 k8s 集群,如果想要工具完整性的话可能还需要适配一个 prometheus 的部署,用来借助 prometheus 查询数据。
全部部署好后,你可以在 test 下找到 case 的 mainfest 文件用来创建一个 bad case 比如 pod pending 。然后运行查询
curl --no-buffer -G "http://ip:30800/ask" --data-urlencode "q=我的集群有什么问题?" 他最终会输出一个完整的报告,md 形式在终端。里面包含了采集到的信息和模型推理的证据结构链路。对了需要在 core.yaml 文件内填入自己的模型 api
https://i.imgur.com/BQNr5vQ.png