问题
有没有现成的工具能在把数据交给 AI/Agent 之前先做个简单脱敏?脱敏后回答会不会变差?
几个开源项目
大概问了 copilot 和看了一下,但是因为不熟悉这个方向不确定对不对,以及哪个更好。
-
OpenPipe/pii-redaction
- https://github.com/OpenPipe/pii-redaction
- 主打在请求前或日志里做 PII 检测与替换(如邮箱、电话等常见敏感字段)
-
PromptMask
- https://github.com/cxumol/promptmask
- 把提示词里的敏感字段先替换成占位符( mask ),等模型返回后再按映射还原;思路是尽量保留上下文结构,同时降低泄露风险。
-
aifw
- https://github.com/funstory-ai/aifw
- 看起来更像是围绕 LLM 调用链的中间层/策略层,把拦截、过滤、审计这类能力插到入口。