当前位置：首页 > news >正文

终极小说下载解决方案：novel-downloader 深度解析与完全指南

news 2026/6/25 19:24:31

终极小说下载解决方案：novel-downloader 深度解析与完全指南

【免费下载链接】novel-downloader一个可扩展的通用型小说下载器。项目地址: https://gitcode.com/gh_mirrors/no/novel-downloader

在数字阅读时代，网络小说已成为众多读者日常消遣的重要方式，然而网站限制、内容下架、网络不稳定等问题常常困扰着阅读爱好者。novel-downloader 作为一款开源、可扩展的浏览器脚本工具，为技术爱好者和进阶用户提供了完整的解决方案，支持超过200个小说网站的内容下载与保存，实现真正的离线阅读自由。这款强大的工具采用模块化架构设计，不仅具备智能解析能力，还提供了丰富的自定义功能，让用户能够高效管理个人数字图书馆。

项目概述与价值主张

novel-downloader 的核心价值在于其多站点兼容性和智能解析能力。作为一款油猴脚本，它直接在浏览器中运行，无需复杂的安装配置，却能实现专业级的下载功能。在404小说文库项目的背景下，这款工具致力于保存那些质量上乘但不够热门、可能从互联网上消失的作品，为数字文化遗产的保护贡献力量。

图：novel-downloader 批量解析界面，展示章节列表与下载日志

核心优势解析

广泛平台支持：工具支持包括起点中文网、晋江文学城、SF轻小说、海棠文化、刺猬猫等主流平台在内的200+小说网站。无论是免费内容还是付费章节，只要用户拥有相应权限，都能一键下载保存。

智能内容解析系统：面对不同网站复杂的页面结构，novel-downloader 采用模块化规则系统。每个网站都有对应的解析规则文件，如 src/rules/onePage/template.ts 提供了单页小说的基础模板，而 src/rules/special/qidian.ts 则专门处理起点中文网的特殊需求。

三层解码技术：针对部分网站将文字替换为图片的防爬措施，工具采用了创新的三层解码方案：

文件名映射：通过图片文件名快速匹配对应文字
哈希映射：计算图片哈希值进行匹配
OCR识别：使用PaddleOCR模型识别图片中的文字

核心架构深度解析

模块化设计哲学

novel-downloader 采用清晰的分层架构，每个组件都有明确的职责：

解析层：负责从网页提取章节列表和内容
处理层：清理HTML、处理图片、解码特殊内容
输出层：生成TXT、EPUB等格式文件
UI层：提供用户界面和进度显示

规则系统设计

项目的核心是高度模块化的规则系统，位于 src/rules/ 目录下，按照网站类型进行分类：

单页小说规则：src/rules/onePage/- 处理章节在同一页面的网站
多页小说规则：src/rules/twoPage/- 处理章节分页显示的网站
特殊站点规则：src/rules/special/- 处理有特殊需求的平台

每个规则文件都继承自BaseRuleClass基类，实现bookParse和chapterParse抽象方法：

// 规则类基础结构示例 export default class CustomSiteRule extends BaseRuleClass { // 书籍信息解析 async bookParse() { // 实现书籍信息提取逻辑 return { bookname: this.bookname, author: this.author, intro: this.intro, coverUrl: this.coverUrl }; } // 章节内容解析 async chapterParse() { // 实现章节内容提取逻辑 const content = await this.getContent(this.doc); return this.cleanDOM(content); } }

核心组件分析

书籍管理模块：src/main/Book.ts 负责管理书籍的元数据和章节信息，包括书名、作者、简介、封面等关键信息。

章节处理模块：src/main/Chapter.ts 处理单个章节的下载、解析和状态管理，支持并发下载和断点续传。

附件处理系统：src/lib/attachments.ts 管理图片等附件的下载和缓存，支持多种下载模式。

图：下载后的小说阅读界面，支持自定义样式调整

快速启动与基础配置

环境准备与安装

novel-downloader 作为油猴脚本，安装过程极其简单：

安装脚本管理器：在浏览器中安装 Tampermonkey、Violentmonkey 或 Greasemonkey
获取脚本：克隆项目仓库git clone https://gitcode.com/gh_mirrors/no/novel-downloader
编译脚本：运行yarn install安装依赖，然后yarn run build生成最终脚本文件
启用脚本：脚本管理器会自动检测并提示安装

技术提示：脚本执行下载任务时会播放无声音频，以保证后台运行时不被浏览器休眠机制中断。

基础使用流程

使用 novel-downloader 下载小说只需三个步骤：

访问目标网站：打开支持的小说目录页面
点击下载图标：页面右上角会出现下载按钮
等待完成：通过右下角进度条或F12控制台查看下载状态

图：典型的小说目录页面，novel-downloader 会自动识别并显示下载按钮

配置文件详解

在 src/setting.ts 中，用户可以调整多项核心参数：

// 核心配置参数示例 export default { // 下载设置 downloadThreads: 3, // 并发下载线程数 downloadInterval: 100, // 下载间隔时间（毫秒） maxDownloadInterval: 1000, // 最大下载间隔 // 输出设置 outputFormat: 'epub', // 默认输出格式 enableDebug: false, // 调试模式开关 // 缓存设置 enableCache: true, // 启用缓存 cacheExpiry: 24 * 60 * 60, // 缓存过期时间（秒） // 存档设置 enableArchiveOrg: true, // 启用互联网档案馆存档 archiveOrgDelay: 5000 // 存档延迟时间 };

高级功能与定制化开发

自定义章节筛选

对于长篇连载小说，你可能只需要下载特定章节。novel-downloader 提供了灵活的自定义筛选功能：

// 只下载前100章 function chapterFilter(chapter) { return chapter.chapterNumber <= 100; } // 只下载包含特定关键词的章节 function chapterFilter(chapter) { return chapter.chapterName.includes("武器"); } // 只下载VIP章节 function chapterFilter(chapter) { return chapter.isVIP && chapter.isPaid; }

输出格式深度定制

通过自定义保存参数，你可以完全控制输出文件的样式和内容：

const saveOptions = { // 自定义章节标题格式 getchapterName: (chapter) => { return `第${chapter.chapterNumber}章 ${chapter.chapterName}`; }, // 调整段落样式 mainStyleText: `p { text-indent: 2em; line-height: 1.8; margin: 0.5em 0; font-family: "Microsoft YaHei", sans-serif; }`, // 删除空行 genChapterEpub: (contentXHTML) => { return contentXHTML .replaceAll("<p><br /></p>", "") .replaceAll("<p><br/></p>", ""); }, // 自定义章节排序 chapterSort: (a, b) => { // 按章节号倒序排列 return b.chapterNumber - a.chapterNumber; } };

付费章节下载配置

对于需要登录的付费网站，如晋江文学城，需要配置相应的 token：

// 晋江文学城token配置 const tokenOptions = { Jjwxc: { token: "11111111_750afc84c839aaaaafccd841fffd11f1", user_key: "11ffffff-11ff-11ff-11ff-111111111fff" }, // 息壤中文网token配置 Xrzww: { deviceIdentify: "webh517657567560", Authorization: "Bearer 453453453e03ee546456546754756756" } };

图：支持图文混排的小说页面，工具能够正确处理图片内容

扩展开发指南

为新的小说网站添加支持非常简单，只需继承BaseRuleClass并实现关键方法：

// 新建规则文件示例 import { BaseRuleClass } from "../rules"; export default class NewSiteRule extends BaseRuleClass { // 初始化配置 constructor() { super(); this.concurrencyLimit = 5; // 设置并发限制 this.sleepTime = 100; // 设置下载间隔 } // 书籍信息解析 async bookParse() { const doc = await this.getHtmlDOM(this.bookUrl); const bookname = doc.querySelector("h1.title").textContent; const author = doc.querySelector(".author").textContent; return { bookname, author, intro: "书籍简介", coverUrl: doc.querySelector(".cover img").src }; } // 章节内容解析 async chapterParse() { const content = this.doc.querySelector(".chapter-content"); return this.cleanDOM(content, { keepClasses: ["highlight", "quote"] }); } }

性能优化与最佳实践

并发下载策略优化

在 src/setting.ts 中调整下载参数以获得最佳性能：

// 针对不同网站的优化配置 const siteOptimizations = { // 高反爬网站 "qidian.com": { concurrencyLimit: 2, sleepTime: 500, maxSleepTime: 2000 }, // 低负载网站 "biquge.com": { concurrencyLimit: 10, sleepTime: 50, maxSleepTime: 500 }, // 默认配置 default: { concurrencyLimit: 5, sleepTime: 100, maxSleepTime: 1000 } };

缓存机制深度利用

novel-downloader 实现了多层缓存系统：

内存缓存：临时存储已下载的章节内容
本地存储缓存：使用GM存储API持久化缓存数据
图片缓存：自动缓存已下载的图片资源
OCR结果缓存：缓存图片文字识别结果

错误处理与调试技巧

当遇到下载问题时，可以启用调试模式：

在设置中开启调试选项
下载生成的ZIP文件中包含debug.log
查看控制台输出获取详细错误信息

// 自定义错误处理 try { await chapter.init(); } catch (error) { log.error(`章节下载失败: ${chapter.chapterName}`, error); // 重试机制 if (chapter.retryTime < 3) { chapter.retryTime++; await sleep(1000); return await this.downloadChapter(chapter); } throw error; }

批量处理自动化

对于系列作品或多部小说，可以编写自动化脚本：

// 批量下载管理器 class BatchDownloader { constructor(urls) { this.urls = urls; this.currentIndex = 0; } async start() { for (const url of this.urls) { console.log(`开始下载: ${url}`); await this.downloadNovel(url); await sleep(5000); // 避免请求过于频繁 } } async downloadNovel(url) { // 打开页面并触发下载 const tab = window.open(url); // 等待下载完成 return new Promise((resolve) => { const checkInterval = setInterval(() => { if (tab.closed) { clearInterval(checkInterval); resolve(); } }, 1000); }); } }

图：下载的TXT文件在文本编辑器中的显示效果，支持Markdown格式和章节层级