最近一直在 Windows 上用 Codex、Claude Code、Hermes 这些 CLI agent,遇到一个很影响体验的小问题:
用微信或 QQ 的快捷键截图,点确认以后,回到终端里直接按 Ctrl+V,经常没反应,或者 CLI agent 识别不到图片。可是如果我先把截图粘到微信/QQ 聊天框里,再从聊天框复制一次,回到 CLI 里粘贴就可以了。
后来确认了一下,问题主要不在 agent,而在 Windows 剪贴板和终端之间:微信/QQ 截图确认后,剪贴板里通常是图片位图格式;很多终端的 Ctrl+V 路径主要处理文本,不会把这类图片数据直接交给 CLI 程序。聊天框相当于帮你把剪贴板内容重新包装了一次。
解决方案:
github.com
GitHub - Greborn/clipboard-image-paste-helper: Paste WeChat/QQ screenshots into Windows terminal...
Paste WeChat/QQ screenshots into Windows terminal CLI agents with Ctrl+V via AutoHotkey and optional Codex skill label resolution.
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:- 我的帖子已经打上 开源推广 标签: 是
- 我的开源项目完整开源,无未开源部分: 是
- 我的开源项目已链接认可 LINUX DO 社区: 是
- 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
- 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
它做什么
这个工具的核心是一个 AutoHotkey v2 脚本。
当你在终端窗口里按 Ctrl+V 时,它会判断当前剪贴板是不是图片:
- 如果不是图片,就走正常粘贴;
- 如果是图片,就把图片保存成临时 PNG;
- 然后往终端里粘贴一个短标签,比如
[image1]、[image2]; - 标签和临时图片路径的映射存在
%TEMP%\cli-clipboard-images\manifest.tsv; - 临时图片默认 6 小时后自动清理。
最终体验是:
微信/QQ 截图 -> 点确认 -> 回到 CLI -> Ctrl+V -> [image1]
这样就不用再把截图先扔到聊天框里过一遍了。
这个不是纯 Codex skill
这里有个边界需要说明清楚:真正让 Ctrl+V 生效的是 Windows 本地的 AutoHotkey 助手,不是 Codex skill。
我仓库里也带了一个可选的 Codex skill,它的作用只是告诉 Codex:当它看到 [image1] 这种标签时,可以怎么解析到本地临时 PNG。
所以如果你用 Cursor 远程连接服务器,即使远程服务器里没装这个 skill,也可能能粘贴出 [image1]。原因是热键拦截发生在你本地 Windows,远程终端收到的只是普通文本。
但要注意:远程服务器里的 agent 通常读不到你本地 Windows 的临时 PNG。也就是说,远程环境里能看到 [image1],不代表一定能读取图片内容。这个场景后续可能需要加一个自动上传/同步机制。
已测试
我这边已经测试过:
- 微信截图可以生成
[image1]; - QQ 截图可以生成
[imageN]; - Windows Terminal / Cursor 终端可用;
- 开机自启动可用。
后续可能优化
现在的版本主要解决本地 Windows 终端体验。后续可能还可以做:
- 远程服务器场景下自动上传图片;
- 支持不同 CLI 的输入格式,比如
@path、-i path; - 做一个托盘菜单,方便暂停、重启、清理临时图片;
- 支持自定义标签格式。
如果大家也在 Windows 上用 CLI agent,并且经常被微信/QQ 截图粘贴折腾,可以试试这个方案。也欢迎提 issue 或直接改。
6 个帖子 - 4 位参与者