当前位置：首页 > news >正文

纯 Node.js 的 PDF 转 Markdown 方案：支持图片解析的pdf2md库 `node-pdf-to-markdown`

news 2026/7/14 23:18:06

🚀 纯 Node.js 的 PDF 转 Markdown 方案：支持图片解析的pdf2md库`node-pdf-to-markdown`

在 Node.js 生态里，“PDF → Markdown” 一直是个被低估但非常刚需的问题。

你可能遇到过这些场景：

服务端需要把用户上传的 PDF 转成可编辑的 Markdown
知识库 / 文档系统想统一用 Markdown 存储
自动化流水线里需要解析论文、技术文档、说明书
不想引入 Python、OCR、Headless Chrome 这些“重量级依赖”

于是我做了一个库：
👉node-pdf-to-markdown——纯 Node.js 环境下的 PDF 解析与 Markdown 转换库，并且原生支持图片解析。

🔍 这个库解决了什么问题？

一句话总结：

在不依赖 Python、不依赖浏览器、不走 OCR 的前提下，把 PDF 结构化地转换成 Markdown，并且把图片一起处理好。

市面上很多 PDF 转换方案，往往存在几个问题：

❌ 依赖 Python（部署成本高、跨环境麻烦）
❌ 依赖浏览器 / Electron（资源占用大）
❌ 只导出纯文本，结构和图片全丢
❌ 输出不可控，难以二次处理

而node-pdf-to-markdown的目标非常明确：
做一个“工程可用”的 Node 端 PDF 解析工具，而不是 demo 级脚本。

⚙️ 核心设计理念

✅ 1. 纯 Node.js 运行环境

这是这个库最重要的一个设计点。

不依赖 Python
不需要 Java
不需要 Chromium / Puppeteer
可以直接运行在：
- Node 服务端
- CLI 工具
- CI / GitHub Actions
- Electron 主进程

npm install 即可用，非常适合现代 Node 工程体系。

🧠 2. 面向 Markdown 的结构化解析

这个库并不是简单地把 PDF 文本“dump”出来，而是尽可能还原文档结构：

标题（不同层级）
段落与换行
列表结构
行内文本格式

最终输出的是**“可继续编辑、可被二次处理的 Markdown”**，而不是一次性产物。

🖼️ 图片解析：这是很多库做不到的地方

图片支持是node-pdf-to-markdown的一个核心亮点。

目前支持4 种图片处理模式，覆盖了几乎所有工程场景。

🔹 1️⃣ none（默认）

不解析图片，适合只关心文本的场景。

🔹 2️⃣ base64

直接把图片转成 Base64，内嵌进 Markdown：

![image](data:image/png;base64,iVBORw0KGgoAAAANSUhEUgA...)

适合场景：

单文件分发
在线预览
不方便管理图片文件的系统

🔹 3️⃣ relative

生成相对路径的 Markdown 引用，同时把图片数据返回给你：

![image](./images/page1_img1.png)

图片保存逻辑由你自己控制，非常适合高度定制化系统。

🔹 4️⃣ save（推荐）

自动保存图片到指定目录，并在 Markdown 中生成引用路径：

![page1_image1](./output/images/page1_image1.png)

这是最接近真实文档迁移场景的一种模式，非常适合：

知识库
博客系统
本地文档管理工具

🧩 使用示例（Node / 服务端友好）

importfsfrom'fs'importpdf2mdfrom'node-pdf-to-markdown'constpdfBuffer=fs.readFileSync('example.pdf')constmdPages=awaitpdf2md(pdfBuffer,{imageMode:'save',imageOutputDir:'./images'})constmarkdown=mdPages.join('\n')fs.writeFileSync('output.md',markdown)

整个流程非常干净：

读取 PDF
解析
拿到 Markdown
图片自动处理

没有多余的环境成本。

🧪 为什么说它适合“工程级使用”？

从设计上，这个库非常适合被集成到更大的系统里：

📦 返回结构清晰的数据，而不是只写文件
📄 Markdown 按页/段输出，方便你二次处理
🧱 图片处理逻辑可控，不强绑定文件系统
🔧 易于封装成 API、CLI 或 SDK

这也是我在做MetaDoc / 智能文档系统时，决定自己写一个 PDF → Markdown 解析库的原因。

📌 适用场景总结

如果你正在做下面这些事情，这个库会非常合适：

文档 / 论文 PDF 转 Markdown
构建文档导入功能
知识库、笔记系统
AI / RAG 系统的文档预处理
Node 服务端批量文档解析

🔗 项目地址

GitHub
👉 https://github.com/JaredYe04/node-pdf-to-markdown
npm
👉 https://www.npmjs.com/package/node-pdf-to-markdown

欢迎 Star / Issue / PR，一起把Node 生态下的 PDF 解析工具做得更工程化 💡

查看全文

http://www.jsqmd.com/news/253054/

FastReport全局变量到底有啥用？3分钟掌握核心用法

JAVA环境下，如何编写一个完整的大文件上传解决方案示例？

Git操作10个常见问题排查：工作中99%的人都遇到过

支付宝携手千问App、淘宝闪购等发布中国首个AI商业协议ACT

Stable Diffusion WebUI+cpolar，随时随地玩转 AI 绘画，不再受限于局域网。

考虑需求响应的微网优化调度模型【粒子群算法】Matlab实现

历届图灵奖与诺贝尔奖获得者经典著作清单

告别“救火式”维修：物联工业网关构建智慧运维新模式

大模型开发指南：12款热门AI Agent工具对比分析，建议程序员收藏学习

cimage图片是什么？压缩技巧和优势全解析

【python】JSON数据 → Python对象（反序列化）

PHP驼峰命名法详解：大驼峰小驼峰区别与正确用法

贴合NMPA注册 GB/T5398-2016助力医药包装运输安全

WinTC编译失败？3个常见原因和解决办法

【AIGC应用】从“机翻”到“爆款文案”：如何用大模型自动润色跨境电商图片？

人工攒问卷 VS 虎贲等考 AI：从 “无效调研” 到 “实证满分” 的蜕变指南

导师推荐！专科生必看！2026 TOP10 AI论文平台测评

DMG‑PEG2000-N-Acetylmannosamine，DMG-聚乙二醇-N-乙酰甘露糖胺，DMG‑PEG2k-ManNAc

贪心算法着色是什么？优缺点与实现步骤详解

强烈安利本科生必用的8款AI论文软件测评

search_path的作用与用法

DMG‑PEG-Glucuronic acid，DMG-聚乙二醇-葡糖酸，DMG‑PEG-GlcA

WKS-动态加载.NET COM DLL,CorBindToRuntimeExObject

图表不再拖后腿！虎贲等考 AI 科研绘图功能让数据 “活” 成顶刊水准

基于PLC的传送带控制系统设计(设计源文件+万字报告+讲解)（支持资料、图片参考_相关定制）

Switch VRF-Lite技术如何为不同业务配置独立出口？

课程论文不再 “凑字数”！虎贲等考 AI：一键解锁高分学术短文的秘密

DMG‑PEG-Sorbitol / Glucitol，DMG-聚乙二醇-葡糖醇，DMG‑PEG-Glc‑PEG-ol

DMG‑PEG-Mannoside，DMG-聚乙二醇-甘露糖苷，DMG‑PEG-Man‑PEG-S