MinerU 系列教程 第十八课:Magic Model 转换层详解
MinerU 系列教程 第十八篇
本篇教程作为模块五:原理篇 - 数据流与中间格式的第二课,将深入剖析 MinerU 的 Magic Model 转换层。每种后端都有一个专属的 Magic Model,负责将各自的原始输出标准化为上一课学习的 Middle JSON 块结构。本课将揭示四个版本的 Magic Model 在块类型映射、坐标转换、内容处理和结构组织上的具体实现差异。
学习目标
完成本课学习后,你将能够:
- 理解 Magic Model 在 MinerU 架构中的统一职责
- 掌握 Pipeline Magic Model 基于 Layout 检测结果的标准化流程
- 了解 VLM Magic Model 如何处理归一化坐标与行内公式提取
- 理解 Hybrid Magic Model 融合 VLM 内容与 Pipeline Span 填充的双模式设计
- 掌握 Office Magic Model 基于 DOCX 原生结构的解析机制
- 对比四个版本的设计差异与共同模式
一、Magic Model 的统一职责
1.1 转换层定位
Magic Model 是 MinerU 架构中的标准化层,位于原始模型输出和 Midd
