[分享发现] [分享] xhs-trail:一个本地优先的小红书创作者数据看板

最近把一个自己用的小工具整理了一下,开源出来了: https://github.com/DeanThompson/xhs-trail 它叫 xhs-trail ,主要用来分析小红书创作者后台导出的「笔记列表明细表.xlsx 」。 背景很简单:小红书后台可以看到每条笔记当前的数据,但如果想看「这条笔记...
[分享发现] [分享] xhs-trail:一个本地优先的小红书创作者数据看板
[分享发现] [分享] xhs-trail:一个本地优先的小红书创作者数据看板

最近把一个自己用的小工具整理了一下,开源出来了:

https://github.com/DeanThompson/xhs-trail

它叫 xhs-trail ,主要用来分析小红书创作者后台导出的「笔记列表明细表.xlsx 」。

背景很简单:小红书后台可以看到每条笔记当前的数据,但如果想看「这条笔记最近 7 天涨了多少」「哪些旧笔记还在长尾增长」「图文和视频到底哪个更适合这个账号」,后台就不太方便。

我自己在做一个很小的小红书账号,3000 多粉,内容偏医学英语、医学词根、临床沟通。账号不大,但复盘需求反而很具体:

  • 一条笔记是不是发完就结束了
  • 有没有旧笔记还在被推荐
  • 某个系列是不是稳定有收藏
  • 视频带来的观看多,还是图文带来的收藏多
  • 哪些内容值得继续写

这些问题只看后台当前总数很难回答。把每天的数据存下来以后,就能看增量和轨迹。

所以我做了一个本地工具:每天导一份 Excel ,工具把它存成 snapshot ,然后按时间窗口计算增量。

目前主要功能:

  • 导入小红书后台 Excel
  • 按快照追踪每篇笔记的曝光、观看、点赞、收藏、评论、涨粉
  • 看最近上升最快的笔记
  • 看发布超过 14 天但仍在增长的长尾笔记
  • 看收藏率高但曝光不足的笔记
  • 按系列分析表现
  • 对比视频 / 图文的总量、篇均和比率指标
  • 本地维护系列规则和关键词
  • CSV 导出
  • CLI 查询,方便给 Agent 或脚本使用

技术栈比较普通:

  • 后端:FastAPI + SQLite
  • 前端:React + Vite
  • 数据处理:Python / pandas / SQLAlchemy
  • 部署:本地运行或 Docker Compose

几个明确的边界:

  • 不做爬虫 / 不做登录代理 / 不接第三方爬虫 API
  • 只处理用户自己从小红书后台导出的 Excel
  • 数据默认保存在本地 SQLite

这样既避免了反爬和合规问题,也保证创作者数据不需要离开本地。后面如果有人需要 hosted 版本,可能会考虑做,但本地开源版会一直保留并免费。

截图在 README 里,示例数据也带了一份脱敏样例。感兴趣可以试试,也欢迎提 issue 。

GitHub:

https://github.com/DeanThompson/xhs-trail

来源: v2ex查看原文