我做了一个桌面端应用,Pai,功能有点多,现已让她自己开发自己,详细情况,听我娓娓道来

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社...
我做了一个桌面端应用,Pai,功能有点多,现已让她自己开发自己,详细情况,听我娓娓道来
我做了一个桌面端应用,Pai,功能有点多,现已让她自己开发自己,详细情况,听我娓娓道来
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
  • 我的帖子已经打上 开源推广 标签:
  • 我的开源项目完整开源,无未开源部分:
  • 我的开源项目已链接认可 LINUX DO 社区:
  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
  • 以上选择我承诺是永久有效的,接受社区和佬友监督:

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出


PAI:从一个一边玩游戏一边快速唤出工作的自家用AI桌面小工具到功能全面的桌面AI枢纽

最初只是想做一个我一边玩游戏一边工作的时候,可以通过快捷键唤出的桌面小工具。
一个月的开发下来功能越来越强大,感觉已经到了可以分享的地步。

基础功能

1. 紧凑美观且完善的 Markdown 渲染

image

2. Skill、MCP、Todo、Plan、记忆、子代理、多供应商、自动压缩、上下文管理、图转文等基础功能应有尽有

image

image

原生支持codex

image

3. 多会话切换,并且多会话支持并行执行任务

image

编程/办公与核心能力类功能

4. 多重降级、高性能稳定、高缓存命中率节省 token 的记忆 RAG

image

并且不像其他应用那样会浪费大量的 token 和额外调用次数生成记忆。
记忆的管理、整合、降级、遗忘,全部都在上下文压缩和会话归档的一次调用中完成。

5. 任务

image

由 LLM 自己发起的长期任务,跟着任务追踪可以发放。

6. AI 可以主动截图,并且编写脚本执行鼠标键盘操作

image

不过经过实测,高分辨率下能稳定执行的大模型并不多。

7. 可撤回的编辑工具,完善的图转文缓存,可以直读 PDF,并且支持以图片方式读 PDF
能够胜任编程、终端执行、文书处理、Office、网络搜索等一系列常见任务。

8. 整个应用拥有一个专属于 AI 的最高权限的工作目录
AI 可以在里面自行设置 Skill、MCP、人格、部门,甚至可以自己管理临时图片、临时附件,自己在里面 clone 项目研究。
除了 AI 应用本身,其他的一切 AI 都可以自己来设置。
结合脚本工具,AI 甚至可以帮你完成本应用自身的设计。

9. 单会话可以设置多种工作目录,并且每个目录都可以单独设置权限

image

10. AI 可以自己压缩上下文
当然这个需要自己去提醒。

11. 灵活切换的向量数据结构
没错,你哪怕换向量模型也不会丢失记忆。其实我不知道为什么别的 RAG 都锁死模型。

12. 对话分支和对话投放
你可以选择一段会话,投放到新会话里面继续对话。
完之后或者你心情好了,你可以选择部分对话然后投放到其他对话里面。
还能自己筛选适合的内容开分支。

image

13. AI 审查
你可以让 AI 帮你审查每一次的工具调用。

image

14. 会话级 Review
除了每个工具的审查,还能一次性审查当前会话的所有改动。

清晰的审查报告一览

image

多层级的审查方式

image

结构化的审查报告,你可以选择你认同的作为附件提交到发言中

image

15. 督工系统
你可以让系统帮你监督 AI 工作。

image

系统会持续监督 LLM 完成任务,不会让 LLM 的中途报告打断任务。

远程、协作与交互类功能

16. 一键唤出、语音唤出,甚至可以后台语音一键唤醒直接回答,甚至不需要额外设置就能实现

image

你可以一边玩游戏一边看电视剧,一边让 AI 吐槽你看到的画面。

17. 远程联系人

image

暂时只支持这4个。

18. 人格 + 部门的提示词 + 权限控制

  • 人格负责绑定记忆
  • 部门负责工作流程 + 工具权限
  • 给部门安排人格实现精细化的控制

19. 表情包系统
是的,LLM 可以发表情。

image

20. 联系人多种处理模式
支持有上下文的对话模式和无上下文的问答模式;关键字激活、始终激活和不激活模式。
在面对群聊的时候,持续观察,自行选择离场。
可以给远程联系人发送文件、图片。对,上面的表情包系统在远程联系人上也是支持的。

21. 快速指令
你可以快速预设一些常见的指令,立刻发送,不用每次都重复打。
只需要按一下 Tab 和回车。

image

22. 同一个会话里面,你可以让多个不同 AI(部门)同时说话

image

也就是说,这不是一对一的会话,而是一个群聊。
并且每个 AI 都能分辨出不同 AI 和用户,不会导致上下文混乱。

23. AI 可以自己激活其他 AI
没错,结合上面的功能,你可以设置一个跑团主持人,然后让 AI 自己生成多个跑团玩家部门和人格,然后看着 AI 自己开始跑团。

24. 后台语音唤醒的同时附带当前画面

image

并且截图会自动管理,不会出现重复截图大量占用上下文的情况。

25. 简单好用的自定义主题色

相信你已经发现了,上面的主题配色截图花样百出,哪怕没有一个能满足你也没关系,你可以自己调。

image

性能与结语

26. 实现以上全部功能,甚至可能还有很多我没想起来的情况下,内存占用不到 100M

image

这是一个 Rust 底层的 Agent,安装包只有 25M,单文件。

结语:
我已经使用pai自己迭代自己超过了一个月。
体验超过了我使用其他的开发软件。
并且试过连续工作十小时以上并最终完美完成任务。

多个朋友已经长期使用超过一个月,完成从法律分析,市场调查,小红书管理,游戏资料整理等一系列复杂任务。


链接

github.com

GitHub - kawayiYokami/P-ai: 可召唤、可委派、可执行的桌面 AI 工作中枢 / A summonable desktop AI…

可召唤、可委派、可执行的桌面 AI 工作中枢 / A summonable desktop AI command center that can plan, delegate, and execute

大概是可以自动更新的。
主要更新环境是 Windows,但是应该也支持 Linux 和 Mac。
linux支持由佬友joegodwanggod完成,但是不知道最新版本还是否能支持。
Mac 需要自己构建,因为没遇到想用的朋友。

因为用的人不多,可能 Bug 会有不少。如果你发现了 Bug,并且觉得好用想继续用下去可以发 Issue,不过我不一定理就是了。如果有能力可以发 PR,带上回归测试,有BUG没关系,只要你PR有想法,我会帮你修好。

没有文档和新手说明,如果需要文档才看得明白说明我UI做得不够好,我更愿意去改UI。

本应用由我个人独立完成。
参考过,并且觉得有价值的项目包括roo,codex,这2个都是非常优秀的项目。
参考过,并且觉得没有参考价值的项目包括…算了还是不说了。

主要就是一个分享。
如果你觉得好用,可以给我一个星。
哪怕你觉得不好用,但是觉得我很努力了,也可以给我一个星。

如果你愿意发视频写分享的话就更好了。

1 个帖子 - 1 位参与者

阅读完整话题

来源: linux.do查看原文