小红书数据采集终极指南:5分钟掌握XHS-Downloader完整使用教程
小红书数据采集终极指南:5分钟掌握XHS-Downloader完整使用教程
【免费下载链接】XHS-Downloader小红书(XiaoHongShu、RedNote)链接提取/作品采集工具:提取账号发布、收藏、点赞、专辑作品链接;提取搜索结果作品、用户链接;采集小红书作品信息;提取小红书作品下载地址;下载小红书作品文件项目地址: https://gitcode.com/gh_mirrors/xh/XHS-Downloader
还在为如何高效采集小红书内容而烦恼吗?XHS-Downloader作为一款专业的开源工具,能够帮助你轻松提取小红书作品信息、批量下载无水印内容,无论是个人创作备份还是数据分析研究,都能提供强大的支持。这款小红书数据采集工具支持多种使用模式,包括图形界面、命令行、API服务和浏览器脚本,满足不同用户的需求。
🔍 为什么选择XHS-Downloader?
在小红书内容日益丰富的今天,高效的内容采集工具显得尤为重要。XHS-Downloader凭借其强大的功能和灵活的配置,成为众多用户的首选解决方案。
核心优势:
- 全面支持:支持发布、收藏、点赞、专辑等多种作品类型
- 智能识别:自动识别作品类型,智能处理图文、视频、livePhoto等格式
- 批量处理:支持多链接同时处理,大幅提升工作效率
- 无水印下载:获取原始无水印文件,保持最佳画质
- 数据完整:采集完整的作品元数据,包括点赞、评论、发布时间等信息
🚀 快速入门:三种部署方式
图形界面模式(推荐新手)
对于不熟悉命令行的用户,图形界面是最佳选择。只需简单几步即可开始使用:
# 克隆项目 git clone https://gitcode.com/gh_mirrors/xh/XHS-Downloader cd XHS-Downloader # 安装依赖 uv sync --no-dev # 启动程序 uv run main.py启动后,你会看到一个直观的操作界面。将小红书作品链接粘贴到输入框中,多个链接用空格分隔,点击"下载作品文件"按钮即可开始下载。
Docker部署(适合服务器环境)
对于需要在服务器环境运行的用户,Docker提供了最便捷的部署方案:
# 拉取最新镜像 docker pull joeanamier/xhs-downloader # 运行容器(TUI模式) docker run -p 5556:5556 -v xhs_data:/app/Volume -it joeanamier/xhs-downloader # 运行容器(API模式) docker run -p 5556:5556 -v xhs_data:/app/Volume -it joeanamier/xhs-downloader python main.py api # 运行容器(MCP模式) docker run -p 5556:5556 -v xhs_data:/app/Volume -it joeanamier/xhs-downloader python main.py mcp源码运行(适合开发者)
如果需要自定义功能或进行二次开发,源码运行提供了最大的灵活性:
# 安装Python 3.12+ python -m venv venv source venv/bin/activate # Linux/Mac # 或 .\venv\Scripts\activate.ps1 # Windows # 安装依赖 pip install -r requirements.txt # 启动程序 python main.py📱 浏览器脚本:网页端直接操作
最便捷的使用方式是在浏览器中直接操作!XHS-Downloader提供了强大的用户脚本,可以直接在小红书网页端使用:
安装步骤:
- 安装Tampermonkey浏览器扩展
- 从URL安装脚本:
https://raw.githubusercontent.com/JoeanAmier/XHS-Downloader/refs/heads/master/static/XHS-Downloader.js - 在小红书网页端会出现侧边菜单
主要功能:
- 提取发布作品链接
- 提取点赞作品链接
- 提取收藏作品链接
- 提取专辑作品链接
- 推送下载任务到服务器
⚙️ 核心功能详解
链接解析与采集
XHS-Downloader支持多种小红书链接格式:
https://www.xiaohongshu.com/explore/作品ID https://www.xiaohongshu.com/discovery/item/作品ID https://www.xiaohongshu.com/user/profile/作者ID/作品ID https://xhslink.com/分享码支持单次输入多个作品链接,链接之间使用空格分隔,程序会自动提取有效链接。
下载配置优化
通过配置文件Volume/settings.json,你可以深度定制下载行为:
{ "name_format": "发布时间 作者昵称 作品标题", "image_format": "JPEG", "folder_mode": false, "max_retry": 5, "timeout": 10, "video_preference": "resolution", "author_archive": false, "write_mtime": false }关键配置说明:
name_format:自定义文件命名规则image_format:支持AUTO、PNG、WEBP、JPEG、HEIC格式video_preference:视频下载偏好(分辨率优先、码率优先、文件大小优先)author_archive:按作者归档作品write_mtime:将文件修改时间设为作品发布时间
Cookie配置指南
为了获取更高质量的内容,建议配置小红书Cookie:
配置步骤:
- 打开浏览器访问
https://www.xiaohongshu.com/explore - 按F12打开开发者工具
- 切换到"网络"标签页
- 勾选"保留日志"
- 在过滤框输入
cookie-name:web_session - 选择任意数据包,全选复制Cookie值
- 在程序或配置文件中设置Cookie参数
🔧 高级使用技巧
命令行模式
对于需要批量处理的用户,命令行模式提供了最大的灵活性:
# 下载单个作品 python main.py --url "https://www.xiaohongshu.com/explore/作品ID" # 批量下载多个作品 python main.py --url "链接1 链接2 链接3" --download true # 自定义下载参数 python main.py --url "作品链接" --work-path "./下载目录" --image-format "WEBP" --folder-mode trueAPI服务器模式
XHS-Downloader提供了完整的API接口,方便与其他系统集成:
import requests # 调用API接口 api_url = "http://127.0.0.1:5556/xhs/detail" payload = { "url": "小红书作品链接", "download": True, "index": [1, 3, 5], # 只下载指定序号的图片 "proxy": "http://127.0.0.1:10808" } response = requests.post(api_url, json=payload, timeout=30) print(response.json())MCP服务配置
支持Model Context Protocol服务模式,方便与AI工具集成:
启动MCP服务:
python main.py mcpMCP URL:http://127.0.0.1:5556/mcp/
📊 实际应用场景
内容创作者备份
作为内容创作者,定期备份自己的作品至关重要:
- 使用浏览器脚本提取自己账号的所有发布作品链接
- 批量下载无水印原文件
- 按时间整理到不同文件夹
- 保存完整的作品信息用于数据分析
竞品分析与市场研究
营销人员和产品经理可以利用XHS-Downloader进行竞品分析:
- 收集竞品账号的作品链接
- 批量下载内容进行分析
- 统计点赞、收藏等互动数据
- 分析内容趋势和用户偏好
学术研究与数据采集
研究人员可以构建高质量的数据集:
- 根据关键词搜索相关作品
- 批量采集内容样本
- 提取文本、图片、视频等多模态数据
- 构建研究数据集
🛠 二次开发指南
XHS-Downloader提供了完善的API接口和模块化设计,方便二次开发:
from source import XHS async def custom_download(): """自定义下载示例""" async with XHS( work_path="./custom_download", folder_name="MyDownloads", name_format="作者昵称_作品标题_发布时间", image_format="WEBP", folder_mode=True, author_archive=True, write_mtime=True ) as xhs: result = await xhs.extract( "https://www.xiaohongshu.com/explore/作品ID", download=True, index=[1, 2, 3] # 只下载前3张图片 ) print(result)核心模块:
source/application/:主要应用逻辑source/module/:核心功能模块source/expansion/:扩展功能source/CLI/:命令行接口source/TUI/:图形界面
📝 注意事项与最佳实践
下载记录管理
XHS-Downloader会将下载过的作品ID储存至数据库,重复下载时会自动跳过。如需重新下载,需要先删除数据库中对应的作品ID。
请求频率控制
为了避免请求频率过高对平台服务器造成影响,项目内置了请求延时机制。建议合理设置请求间隔,避免触发反爬机制。
文件完整性检查
项目实现了作品文件完整性处理机制,确保下载的文件完整可用。如果下载过程中断,支持断点续传功能。
多语言支持
项目支持中文和英文界面,通过配置文件中的language参数设置:
zh_CN:简体中文en_US:英文
🤝 社区与贡献
XHS-Downloader是一个活跃的开源项目,欢迎社区参与:
贡献方式:
- 报告问题:在项目仓库提交Issue
- 提交代码:通过Pull Request贡献代码
- 改进文档:帮助完善使用文档和教程
- 分享经验:在社区分享使用技巧
项目地址:https://gitcode.com/gh_mirrors/xh/XHS-Downloader
联系作者:
- 邮箱:yonglelolu@foxmail.com
- Discord社区:https://discord.com/invite/ZYtmgKud9Y
⚠️ 使用注意事项
- 尊重版权:请遵守平台规则,仅将工具用于合法合规的用途
- 合理使用:避免过度频繁请求,尊重平台服务器资源
- 数据安全:妥善保管下载的内容,遵守相关法律法规
- 技术限制:部分功能可能需要Cookie配置才能获得最佳效果
- 版本更新:建议定期更新到最新版本以获得最佳体验
🎯 开始使用
现在你已经了解了XHS-Downloader的强大功能,是时候开始使用了!无论你是需要备份个人作品的内容创作者,还是需要进行数据分析的研究人员,这款工具都能为你提供强大的支持。
立即开始:
git clone https://gitcode.com/gh_mirrors/xh/XHS-Downloader cd XHS-Downloader uv sync --no-dev uv run main.py祝你使用愉快!如果在使用过程中遇到任何问题,欢迎查阅项目文档或参与社区讨论。
【免费下载链接】XHS-Downloader小红书(XiaoHongShu、RedNote)链接提取/作品采集工具:提取账号发布、收藏、点赞、专辑作品链接;提取搜索结果作品、用户链接;采集小红书作品信息;提取小红书作品下载地址;下载小红书作品文件项目地址: https://gitcode.com/gh_mirrors/xh/XHS-Downloader
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
