XHS-Downloader收藏夹提取:一键备份小红书点赞与收藏内容
痛点直击:收藏内容管理的3大困境
你是否还在为这些问题烦恼?
- 收藏夹内容过多导致查找困难,手动整理耗时耗力
- 担心喜欢的笔记被删除或隐藏,心血收藏付诸东流
- 换设备或账号时,收藏内容无法迁移,重新收藏成本高
本文将通过XHS-Downloader实现: ✅ 一键提取整个收藏夹链接 ✅ 无水印批量下载收藏内容 ✅ 按分类自动归档文件 ✅ 本地备份防止内容丢失
技术原理:收藏内容提取流程解析
工作流程图
核心功能对比
| 操作方式 | 耗时 | 操作复杂度 | 能否批量处理 | 数据安全性 |
|---|---|---|---|---|
| 手动逐个保存 | 高(每个作品需3-5步) | 高 | 否 | 高 |
| 第三方截图工具 | 中 | 中 | 部分支持 | 低(有水印) |
| XHS-Downloader方案 | 低(全程3步) | 低 | 是 | 高 |
准备工作:5分钟环境部署
前置条件
- Python 3.12+ 环境
- Chrome/Edge浏览器
- Tampermonkey扩展
- Git工具
安装步骤
1. 获取项目源码
git clone https://gitcode.com/gh_mirrors/xh/XHS-Downloader
cd XHS-Downloader
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt
2. 安装Tampermonkey脚本
- 打开Tampermonkey扩展
- 点击「实用工具」→「从URL安装」
- 输入脚本地址:
https://gitcode.com/gh_mirrors/xh/XHS-Downloader/raw/master/static/XHS-Downloader.js - 确认安装并启用
3. 启动程序
# 图形界面模式
python main.py
# 命令行模式
python main.py --help
实战教程:三步备份收藏内容
第一步:提取收藏夹链接
操作要点:
- 收藏内容较多时,启用"自动滚动"功能(默认50次滚动)
- 私密收藏夹需确保账号已登录
- 提取完成后脚本会提示"已复制X条链接"
第二步:配置下载参数
启动XHS-Downloader后,在设置界面配置:
{
"author_archive": true, // 按作者分类存储
"folder_mode": true, // 每个作品单独文件夹
"name_format": "发布时间 作品标题", // 文件命名格式
"download_record": true, // 记录下载历史,避免重复
"image_format": "WEBP" // 图片格式(PNG/WEBP/JPEG/HEIC)
}
参数说明:
author_archive: 启用后按"作者ID_作者昵称"创建文件夹folder_mode: 单个作品包含多图时建议启用image_format: 追求质量选PNG,追求存储效率选WEBP
第三步:批量下载与管理
操作步骤:
- 在XHS-Downloader主界面选择"批量下载"
- 粘贴从收藏夹提取的链接(支持空格分隔的多个链接)
- 点击"开始下载",程序将自动:
- 验证链接有效性
- 解析作品元数据
- 下载无水印文件
- 按配置规则分类存储
默认存储路径:./Volume/Download,可在设置中修改work_path参数自定义位置
高级技巧:收藏内容管理进阶
1. 选择性下载
通过命令行模式可指定下载特定序号的图片:
# 仅下载第1、3、5张图片(从1开始计数)
python main.py --url "收藏夹链接" --index 1 3 5
2. 增量备份方案
启用download_record: true后,程序会自动:
- 将已下载作品ID保存到
ExploreID.db - 新链接列表会与数据库比对
- 仅下载从未保存过的作品
3. 收藏夹分类备份
利用Tampermonkey脚本的"提取专辑作品链接"功能,可实现:
- 将收藏内容按专辑分类
- 分别提取每个专辑链接
- 在本地建立对应文件夹结构
- 实现收藏内容的结构化备份
4. 定期自动备份
创建批处理脚本(Windows示例):
@echo off
cd /d "XHS-Downloader安装路径"
python main.py --clipboard --auto_exit
配合Windows任务计划程序,可实现定期自动备份剪贴板中的收藏夹链接。
常见问题解决方案
1. 收藏夹链接提取不完整
- 可能原因:滚动次数不足
- 解决方法:在Tampermonkey脚本设置中增加
maxScrollCount值(默认50),建议设置为100
2. 下载速度慢
- 优化方案:
{ "chunk": 20971520, // 增大分块大小至20MB "max_retry": 3 // 减少重试次数 }
3. 作品下载失败
- 错误排查流程:
- 检查网络连接
- 确认链接是否有效(收藏夹链接有时效性)
- 尝试更新Cookie(设置中使用"从浏览器读取Cookie"功能)
- 查看日志文件:
./Volume/logs
4. 文件名乱码
- 解决方法:确保系统编码为UTF-8,或修改
name_format参数:{ "name_format": "作品ID 发布时间" // 避免使用特殊字符 }
注意事项与法律声明
-
使用规范:
- 本工具仅用于个人学习研究
- 下载内容请遵守平台用户协议
- 尊重原创作者权益,未经允许不得商用
-
数据安全:
- 所有下载操作均在本地完成
- 程序不会上传任何用户数据
- 建议定期备份
ExploreID.db避免下载记录丢失
-
风险提示:
- 过度频繁下载可能导致账号风控
- 自动滚动功能建议谨慎使用,可能触发平台反爬机制
- 私密收藏内容提取需确保账号处于登录状态
总结与展望
通过XHS-Downloader实现小红书收藏夹内容的一键备份,不仅解决了手动管理的痛点,更提供了系统化的内容管理方案。核心优势包括:
- 高效率:从几小时缩短到几分钟的备份流程
- 高质量:获取无水印原始分辨率文件
- 灵活性:支持自定义分类和命名规则
- 安全性:本地存储确保数据不泄露
未来版本将重点优化收藏内容的智能管理功能,包括标签识别、内容检索和自动分类,进一步提升个人知识库的构建效率。
项目开源地址:https://gitcode.com/gh_mirrors/xh/XHS-Downloader,欢迎贡献代码或反馈问题。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



