各位佬好,
最近在折腾本地 AI Agent 和自动化工作流,顺手把 Claude Code (Opus 4.7 驱动) 作为一个中枢,搞了一套多模型协同的自动化编排机制。感觉跑通之后生产力拉满,特来社区和大家分享一下架构思路,也顺便请教探讨一下后续的优化方向。
先上整体架构图,直观看看这个 “缝合怪” 是怎么运转的:
核心设计思路
整个工作流以接收到的输入作为起点,由 Claude Code 作为“大脑”决定调用哪些工具,并通过 Bash tool 执行 Shell 命令。目前主要分化出三条并行的处理线:
生图线 (Image Line)
- 链路:
opencli→localhost:19825 OpenCLI daemon→Chrome Extension Bridge→ 真实 Chrome 浏览器。 - 亮点: 直接利用了我本地已登录状态的 Chrome 浏览器环境(Gemini/NotebookLM 等),通过自动化脚本完成网页生成、抓取并下载 PNG 到
.local/opencli_artifacts/。免去了繁琐的 API 鉴权,直接走真实环境抓取。
评审线 (Review Line)
- 链路:
omc ask驱动 →Codex CLI (gpt-5.5)&Gemini CLI (3.0 Flash)。 - 亮点: 多个轻量/快速模型各自走自己的 API Auth 独立并发评审,评审结果以 Markdown 格式沉淀到本地的
.omc/artifacts/ask/目录下(如codex-<ts>.md)。
神文案线 (Content Line)
- 链路: Python 脚本 (
poly_llm.py) →requests + urllib→DeepSeek API (api.deepseek.com)。 - 亮点: 接入 DeepSeek 的 v4-pro 生成高质量文案,同样作为 artifact 落盘保存。
最终的综合与输出 (Synth)
所有并行的任务跑完后,Claude Code 会使用 Read 工具把刚才落盘的所有 artifact (各种 .md 结果和图片元数据) 重新读回来。 交由 Claude Opus 进行跨模型矩阵对比,提取出各个模型视角的 unique findings (
),最终输出一份 v0.2 版本的完整建议报告。
探讨与求教
目前这套跑下来基本能满足我日常的代码评审和图文生成需求,但感觉在 Chrome Extension Bridge 那里的稳定性还有提升空间。
不知道社区里有没有佬也在用类似的思路做多模型 Orchestration? 大家在处理多节点并发和本地文件 artifact 状态同步时,有没有什么更优雅的方案(比如直接上 n8n 会不会更好)?欢迎在评论区交流指点!
顺便求个赞,正努力向 L3 迈进,感谢各位佬的支持! ![]()
2 个帖子 - 1 位参与者