最近把一个自己用的小工具整理了一下,开源出来了:
https://github.com/DeanThompson/xhs-trail
它叫 xhs-trail ,主要用来分析小红书创作者后台导出的「笔记列表明细表.xlsx 」。
背景很简单:小红书后台可以看到每条笔记当前的数据,但如果想看「这条笔记最近 7 天涨了多少」「哪些旧笔记还在长尾增长」「图文和视频到底哪个更适合这个账号」,后台就不太方便。
我自己在做一个很小的小红书账号,3000 多粉,内容偏医学英语、医学词根、临床沟通。账号不大,但复盘需求反而很具体:
- 一条笔记是不是发完就结束了
- 有没有旧笔记还在被推荐
- 某个系列是不是稳定有收藏
- 视频带来的观看多,还是图文带来的收藏多
- 哪些内容值得继续写
这些问题只看后台当前总数很难回答。把每天的数据存下来以后,就能看增量和轨迹。
所以我做了一个本地工具:每天导一份 Excel ,工具把它存成 snapshot ,然后按时间窗口计算增量。
目前主要功能:
- 导入小红书后台 Excel
- 按快照追踪每篇笔记的曝光、观看、点赞、收藏、评论、涨粉
- 看最近上升最快的笔记
- 看发布超过 14 天但仍在增长的长尾笔记
- 看收藏率高但曝光不足的笔记
- 按系列分析表现
- 对比视频 / 图文的总量、篇均和比率指标
- 本地维护系列规则和关键词
- CSV 导出
- CLI 查询,方便给 Agent 或脚本使用
技术栈比较普通:
- 后端:FastAPI + SQLite
- 前端:React + Vite
- 数据处理:Python / pandas / SQLAlchemy
- 部署:本地运行或 Docker Compose
几个明确的边界:
- 不做爬虫 / 不做登录代理 / 不接第三方爬虫 API
- 只处理用户自己从小红书后台导出的 Excel
- 数据默认保存在本地 SQLite
这样既避免了反爬和合规问题,也保证创作者数据不需要离开本地。后面如果有人需要 hosted 版本,可能会考虑做,但本地开源版会一直保留并免费。
截图在 README 里,示例数据也带了一份脱敏样例。感兴趣可以试试,也欢迎提 issue 。
GitHub:
https://github.com/DeanThompson/xhs-trail