当前位置：首页 > news >正文

守护数字记忆：开源小说下载器如何拯救100+网站的文学遗产

news 2026/6/26 10:02:42

守护数字记忆：开源小说下载器如何拯救100+网站的文学遗产

【免费下载链接】novel-downloader一个可扩展的通用型小说下载器。项目地址: https://gitcode.com/gh_mirrors/no/novel-downloader

在数字阅读时代，小说网站的突然关闭、章节的无故消失，让无数读者与心爱的作品失之交臂。那些曾经陪伴我们深夜的文字，那些构建了无数想象世界的篇章，正以惊人的速度从互联网上消失。而一个开源项目，正悄然成为这些数字记忆的守护者。

novel-downloader小说下载器，这个可扩展的通用型工具，不仅支持超过100个国内外小说网站，更承载着保存数字文化遗产的使命。当你在起点中文网、晋江文学城、カクヨム、pixiv等平台发现心仪的小说时，只需轻轻一点，就能将完整的作品保存为TXT和EPUB格式，建立属于你自己的离线图书馆。

📖 当小说从网络消失：数字时代的阅读困境

场景一：通勤途中的阅读中断李华每天通勤两小时，习惯在手机上看小说打发时间。上周，他追更的小说突然在原网站下架，而转载网站只更新到一半。没有网络信号的地铁里，他只能面对空白的屏幕发呆。

场景二：学术研究的资料缺失王教授正在研究网络文学的发展脉络，需要收集特定时期的多部作品作为样本。然而，当他开始查找时，发现近30%的参考文献链接已经失效——网站关闭、章节删除、甚至整部作品都无处可寻。

场景三：付费内容的保存困境张小姐在晋江文学城购买了全本VIP小说，花费了数百元。一年后她想重温时，却发现该作品因版权问题被平台下架。虽然已付费，却再也无法访问自己购买的内容。

这些场景每天都在上演，而novel-downloader正是为解决这些问题而生。它不仅仅是下载工具，更是对抗数字内容消失的防线。

novel-downloader正在分析网页结构并批量下载章节内容，智能处理各种反爬虫机制

🔧 三重防护：智能应对网站反爬虫策略

智能OCR图像识别系统

部分小说网站采用图片替换文字的方式防止内容被抓取。novel-downloader采用三层递进解码方案：

文件名映射：最快速度匹配图片文件名与文字对应关系
哈希值匹配：计算图片哈希值进行快速比对
OCR识别：使用PaddleOCR中文识别模型进行精准文字识别

这套系统确保即使是最复杂的图片文字也能被正确提取，识别准确率高达98%以上。

字体加密解密机制

晋江文学城等平台使用自定义字体显示文字，普通下载工具只能获取乱码。novel-downloader会自动下载字体文件并建立映射关系，确保文字正确显示。当遇到新字体时，系统会提示用户提交字体链接，社区共同维护字体映射库。

动态内容处理技术

针对单页应用（SPA）网站，脚本会等待页面完全加载后再进行解析。通过模拟真实用户行为，避开网站的反爬虫检测，确保获取完整的小说内容。

novel-downloader能够正确处理包含图片的小说章节，保留完整的阅读体验

🚀 五分钟搭建个人数字图书馆

第一步：环境准备

确保浏览器已安装以下任一脚本管理器：

Tampermonkey：最流行的选择，兼容性最佳
Violentmonkey：开源免费替代方案
Greasemonkey：Firefox专用版本

第二步：获取并安装脚本

git clone https://gitcode.com/gh_mirrors/no/novel-downloader cd novel-downloader yarn install yarn build

构建完成后，在dist目录中找到bundle.user.js文件，通过脚本管理器安装即可。

第三步：开始下载之旅

访问支持的小说网站，打开小说目录页面。当你看到页面右上角出现下载图标时，点击它，下载就开始了！脚本会自动分析页面结构，批量下载所有章节。

🌐 全方位网站支持：覆盖主流与小众平台

国内主流平台深度支持

起点中文网：支持公共章节和VIP章节下载
晋江文学城：支持字体解密和付费章节
长佩文学：反爬较严，每分钟约可下载6章
七猫中文网：需先进入作品目录再运行脚本

国外小说平台

カクヨム：日本最大的小说投稿网站
小説家になろう：日本轻小说创作平台
pixiv小说：知名插画网站的小说板块

转载与资源网站

笔趣阁系列：多个笔趣阁变体网站
UU看书网：热门小说转载平台
和图书：经典文学资源站点

清晰的小说目录界面，便于选择下载内容，支持按卷、按章节筛选

💡 高级技巧：定制化下载体验

智能章节筛选

通过自定义筛选函数，可以精准控制下载内容：

// 只下载前50章 function chapterFilter(chapter) { return chapter.chapterNumber <= 50; } // 只下载特定卷的内容 function chapterFilter(chapter) { return chapter.sectionName === "第一卷"; } // 按关键词筛选章节 function chapterFilter(chapter) { return chapter.chapterName.includes("决战"); }

个性化输出格式

完全控制生成文件的样式和格式：

const saveOptions = { // 自定义章节标题格式 getchapterName: (chapter) => { return `第${chapter.chapterNumber}章 ${chapter.chapterName || ""}`; }, // 自定义段落样式 mainStyleText: ` p { text-indent: 2em; line-height: 1.8; margin: 1em 0; font-family: "思源宋体", serif; } `, };

自动注入配置

通过用户脚本实现自动化配置：

// ==UserScript== // @name Noveldownloader Settings // @namespace http://tampermonkey.net/ // @version 0.1 // @description 自动注入novel-downloader配置 // @author You // @match *://*/* // @grant none // ==/UserScript== (function() { const tokenOptions = { Jjwxc: "your_token_here", }; const saveOptions = { getchapterName: (chapter) => { return `第${chapter.chapterNumber}章 ${chapter.chapterName || ""}`; }, }; window.tokenOptions = tokenOptions; window.saveOptions = saveOptions; })();

下载后的小说以整洁的TXT格式保存，便于在各种设备上阅读和分享

🛠️ 开发者扩展指南：为项目添砖加瓦

添加新网站支持

项目采用模块化设计，添加新网站非常简单：

创建规则文件在src/rules/相应目录下创建新的TypeScript文件

继承基础类

import { BaseRuleClass } from "../lib/rule"; export default class NewSite extends BaseRuleClass { public siteName = "new-site"; public urlPattern = /https:\/\/www\.newsite\.com\/novel\/.+/; public async bookParse() { // 实现书籍信息提取逻辑 } public async chapterParse() { // 实现章节内容提取逻辑 } }

注册规则在src/rules.ts中添加新规则，并在src/header.json中配置匹配模式。

项目架构概览

src/ ├── rules/ # 网站解析规则 │ ├── onePage/ # 单页模式网站 │ ├── twoPage/ # 两页模式网站 │ ├── special/ # 特殊处理网站 │ └── lib/ # 共享工具库 ├── main/ # 核心业务逻辑 ├── lib/ # 通用工具函数 ├── save/ # 文件保存模块 └── ui/ # 用户界面组件