架构分享】利用 Claude Code 打造多模型“缝合”自动化工作流:串接 DeepSeek + Gemini + Opus 的实践

各位佬好, 最近在折腾本地 AI Agent 和自动化工作流,顺手把 Claude Code (Opus 4.7 驱动) 作为一个中枢,搞了一套多模型协同的自动化编排机制。感觉跑通之后生产力拉满,特来社区和大家分享一下架构思路,也顺便请教探讨一下后续的优化方向。 先上整体架构图,直观看看这个 “缝合...
架构分享】利用 Claude Code 打造多模型“缝合”自动化工作流:串接 DeepSeek + Gemini + Opus 的实践
架构分享】利用 Claude Code 打造多模型“缝合”自动化工作流:串接 DeepSeek + Gemini + Opus 的实践

各位佬好,

最近在折腾本地 AI Agent 和自动化工作流,顺手把 Claude Code (Opus 4.7 驱动) 作为一个中枢,搞了一套多模型协同的自动化编排机制。感觉跑通之后生产力拉满,特来社区和大家分享一下架构思路,也顺便请教探讨一下后续的优化方向。

先上整体架构图,直观看看这个 “缝合怪” 是怎么运转的:

image

:light_bulb: 核心设计思路

整个工作流以接收到的输入作为起点,由 Claude Code 作为“大脑”决定调用哪些工具,并通过 Bash tool 执行 Shell 命令。目前主要分化出三条并行的处理线:

  1. :framed_picture: 生图线 (Image Line)
  • 链路: openclilocalhost:19825 OpenCLI daemonChrome Extension Bridge → 真实 Chrome 浏览器。
  • 亮点: 直接利用了我本地已登录状态的 Chrome 浏览器环境(Gemini/NotebookLM 等),通过自动化脚本完成网页生成、抓取并下载 PNG 到 .local/opencli_artifacts/。免去了繁琐的 API 鉴权,直接走真实环境抓取。
  1. :face_with_monocle: 评审线 (Review Line)
  • 链路: omc ask 驱动 → Codex CLI (gpt-5.5) & Gemini CLI (3.0 Flash)
  • 亮点: 多个轻量/快速模型各自走自己的 API Auth 独立并发评审,评审结果以 Markdown 格式沉淀到本地的 .omc/artifacts/ask/ 目录下(如 codex-<ts>.md)。
  1. :writing_hand: 神文案线 (Content Line)
  • 链路: Python 脚本 (poly_llm.py) → requests + urllibDeepSeek API (api.deepseek.com)
  • 亮点: 接入 DeepSeek 的 v4-pro 生成高质量文案,同样作为 artifact 落盘保存。

:brain: 最终的综合与输出 (Synth)

所有并行的任务跑完后,Claude Code 会使用 Read 工具把刚才落盘的所有 artifact (各种 .md 结果和图片元数据) 重新读回来。 交由 Claude Opus 进行跨模型矩阵对比,提取出各个模型视角的 unique findings (:star:),最终输出一份 v0.2 版本的完整建议报告。

:thinking: 探讨与求教

目前这套跑下来基本能满足我日常的代码评审和图文生成需求,但感觉在 Chrome Extension Bridge 那里的稳定性还有提升空间。

不知道社区里有没有佬也在用类似的思路做多模型 Orchestration? 大家在处理多节点并发和本地文件 artifact 状态同步时,有没有什么更优雅的方案(比如直接上 n8n 会不会更好)?欢迎在评论区交流指点!

顺便求个赞,正努力向 L3 迈进,感谢各位佬的支持! :handshake:

2 个帖子 - 1 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文