当前位置：首页 > news >正文

数据烂在系统里，新药就堵在申报门口-数据烂在系统里，新药就堵在申报门口** ## 写给每一位正在冲刺 IND 的 CMC 研发团队 - lcs

news 2026/6/23 8:02:11

数据烂在系统里，新药就堵在申报门口-数据烂在系统里，新药就堵在申报门口** ## 写给每一位正在冲刺 IND 的 CMC 研发团队

更贴近药企研发业务实际、更强调研发进度与申报成败的文章。受众是研发高管、CMC 负责人和注册申报团队，而不是 QA 合规视角。

---

# **数据烂在系统里，新药就堵在申报门口**

## 写给每一位正在冲刺 IND 的 CMC 研发团队

---

每一家创新药企，都有一本关于"最后一公里"的辛酸账。

分子筛选跑了两年，动物实验跑了一年，CMO 工艺放大又跑了半年。当所有人都以为申报材料只差"整理一下"的时候，项目经理才发现——真正的噩梦，其实刚刚开始。

申报团队打开 CTD 模块 3 的草稿，开始逐页核对数据。

批分析报告里的纯度值，和 ELN 里的记录对不上。

稳定性报告引用的方法版本，比实际执行的方法晚了两个版本。

QA 要求提供某一批次含量检测的原始图谱，但那份 CDS 导出文件已经被覆盖或找不到了。

负责人问：这个数据是怎么来的？没有人能在一小时内给出一个有证据支撑的答案。

这不是个别企业的特例。这是整个行业在"数据管理"这件事上长期欠下的债，在申报冲刺阶段集中到期。

---

## **为什么数据问题总是在最关键的时候爆发？**

表面上看，是"系统没打通"、"数据没同步"。

但更深层的原因是：**药企的数字化建设，长期以来是以"系统"为中心的，而不是以"数据的流动和证明"为中心的。**

LIMS 管样品和检测任务，CDS 管图谱和积分，ELN 管实验记录，QMS 管变更和偏差，每个系统都在自己的边界内运转得很好。但当申报人员需要证明"这份报告里的这个数字，是用这个方法、在这个时间、由这个人、从这批样品里检测出来的"，没有任何一个系统能直接给出完整的答案。

于是，人就成了系统之间的"数据搬运工"。

分析员从 CDS 里导出 Excel，手工把数值填进 ELN；ELN 里的数值再被手工复制进 Word 报告；Word 报告打印出来给负责人签字，再扫描成 PDF 存进文件服务器。每一次搬运，都是一次出错的机会。每一次出错，在申报阶段被发现，代价都是以月计的延误。

**数据没有烂，但证明数据的链条断了。这才是真正的问题。**

---

## **申报审评官在看什么？**

理解这个问题，要先理解监管机构的审评逻辑。

无论是 NMPA/CDE 的技术审评，还是 FDA 的 CMC 审查，审评官看到一个数据时，脑子里转的不是"这个数对不对"，而是"**这个数我能不能信**"。

能不能信，取决于三件事：

第一，**这个数是怎么产生的**——用的是什么方法，方法有没有经过验证，检测条件有没有偏离。

第二，**这个数有没有被动过手脚**——从仪器输出到最终报告，中间经过了几个人的手，有没有修改记录，修改的原因是什么。

第三，**如果数据有问题，有没有被如实记录和处理**——出现过 OOS 吗？有没有开偏差？偏差调查结论是什么？

这三件事，在中国 NMPA 近年来的技术审评反馈中，被反复提及的频率越来越高。CDE 在 2024 年发布的多份技术指导原则里，明确要求申报企业提供**数据可溯源性声明**，并在现场核查中重点检查原始数据与申报数据的一致性。

**监管趋势已经非常清晰：光有数据不够，要有证明数据的证据链。**

---

## **一条证据链，究竟能改变什么？**

我们不妨用一个具体的场景来说明。

某创新药企正在准备 IND 申报，CMC 模块中有一批关键的 HPLC 纯度数据，共涉及 6 个批次、3 个时间点、2 套检测方法。按照传统做法，整理这些数据需要：分析员从 CDS 里导出 18 份 Excel 结果表，逐份核对后手工汇总进批分析总结；QA 核查时需要逐份比对原始图谱和汇总表，确认数值一致、方法版本正确、检测日期合理。

这个过程，保守估计需要一个有经验的 QA 花费 3 到 5 个工作日。如果发现问题，还要追溯到分析员重新确认，再加 1 到 2 天。

现在换一种方式。

每一批次的检测任务在下达时，就已经锁定了样品批号、方法版本和判断标准。分析员完成检测后，直接上传仪器导出的结果表，系统自动提取关键数值，不需要手工填写任何数字。批分析总结由系统自动生成，每一个数值背后都挂着它来自哪份文件的哪个单元格。

QA 打开这份总结，点击任意一个数值，3 秒内就能看到：原始文件、检测日期、执行人、复核人、有没有发生过文件替换、替换原因是什么。全部一屏呈现，不需要跨系统查询，不需要打电话问分析员。

**3 到 5 个工作日，变成了 3 秒。**

这不是技术噱头。这是对研发资源的重新分配——把人从机械的核对工作中解放出来，去做真正需要人类判断的事情。

---

## **证据链对研发进度的影响，比你想象的更深远**

很多研发高管在听到"数据追溯"时，第一反应是"这是 QA 的事"。

这个认知需要更新。

**数据追溯能力，直接影响研发决策的速度。**

当课题负责人在讨论工艺优化方案时，需要快速调取过去 6 个月所有相关批次的纯度趋势数据。如果数据散落在各个分析员的本地文件夹里，这个调取过程可能需要 2 天。如果有完整的证据链系统，这个过程是 10 分钟。

2 天和 10 分钟的差距，在工艺开发阶段可能意味着一个迭代周期的延误。在申报冲刺阶段，可能直接影响 IND 递交的窗口期。

**数据追溯能力，直接决定现场核查的通过率。**

NMPA 的现场核查，最常见的问题之一就是"申报数据与原始记录不一致"。不一致的原因，很多时候不是造假，而是数据搬运过程中的笔误或版本混淆。但在核查现场，你没有时间去解释这是笔误——你只有时间拿出证据。

有证据链的企业，在核查现场能做到：审评官指出任意一个数据疑点，5 分钟内给出完整的溯源记录。没有证据链的企业，往往只能请求"给我们一天时间去查一查"。

**这两种状态，核查结论会截然不同。**

---

## **新药研发，本质上是一场信任的建立**

从第一个化合物筛选，到最终拿到上市批件，整个过程的本质，是药企在向监管机构、向医生、向患者，逐步建立信任。

每一份严谨的分析报告，每一条清晰的数据来源，每一个有迹可查的修改记录，都是信任的砖块。

反过来，每一个说不清来源的数据，每一份找不到底层原始记录的报告，都是在这座信任大厦上凿洞。洞凿得越多，申报越难，核查越险，上市越慢。

**CMC 分析数据核对与追溯助手**，做的事情说穿了只有一件：**帮药企把这些砖块，一块一块、严丝合缝地砌好，让任何人在任何时候，都能清楚地看到这座大厦是怎么建起来的。**

当申报材料里的每一个数字都坚如磐石，当审评官的每一个疑问都能在 30 秒内得到有证据支撑的回答，新药上市的步伐，自然会走得更稳、更快。

---