当前位置: 首页 > news >正文

数据烂在系统里,新药就堵在申报门口-数据烂在系统里,新药就堵在申报门口** ## 写给每一位正在冲刺 IND 的 CMC 研发团队 - lcs

数据烂在系统里,新药就堵在申报门口-数据烂在系统里,新药就堵在申报门口** ## 写给每一位正在冲刺 IND 的 CMC 研发团队

更贴近药企研发业务实际、更强调研发进度与申报成败的文章。受众是研发高管、CMC 负责人和注册申报团队,而不是 QA 合规视角。

---

# **数据烂在系统里,新药就堵在申报门口**

## 写给每一位正在冲刺 IND 的 CMC 研发团队

---

每一家创新药企,都有一本关于"最后一公里"的辛酸账。

分子筛选跑了两年,动物实验跑了一年,CMO 工艺放大又跑了半年。当所有人都以为申报材料只差"整理一下"的时候,项目经理才发现——真正的噩梦,其实刚刚开始。

申报团队打开 CTD 模块 3 的草稿,开始逐页核对数据。

批分析报告里的纯度值,和 ELN 里的记录对不上。

稳定性报告引用的方法版本,比实际执行的方法晚了两个版本。

QA 要求提供某一批次含量检测的原始图谱,但那份 CDS 导出文件已经被覆盖或找不到了。

负责人问:这个数据是怎么来的?没有人能在一小时内给出一个有证据支撑的答案。

这不是个别企业的特例。这是整个行业在"数据管理"这件事上长期欠下的债,在申报冲刺阶段集中到期。

---

## **为什么数据问题总是在最关键的时候爆发?**

表面上看,是"系统没打通"、"数据没同步"。

但更深层的原因是:**药企的数字化建设,长期以来是以"系统"为中心的,而不是以"数据的流动和证明"为中心的。**

LIMS 管样品和检测任务,CDS 管图谱和积分,ELN 管实验记录,QMS 管变更和偏差,每个系统都在自己的边界内运转得很好。但当申报人员需要证明"这份报告里的这个数字,是用这个方法、在这个时间、由这个人、从这批样品里检测出来的",没有任何一个系统能直接给出完整的答案。

于是,人就成了系统之间的"数据搬运工"。

分析员从 CDS 里导出 Excel,手工把数值填进 ELN;ELN 里的数值再被手工复制进 Word 报告;Word 报告打印出来给负责人签字,再扫描成 PDF 存进文件服务器。每一次搬运,都是一次出错的机会。每一次出错,在申报阶段被发现,代价都是以月计的延误。

**数据没有烂,但证明数据的链条断了。这才是真正的问题。**

---

## **申报审评官在看什么?**

理解这个问题,要先理解监管机构的审评逻辑。

无论是 NMPA/CDE 的技术审评,还是 FDA 的 CMC 审查,审评官看到一个数据时,脑子里转的不是"这个数对不对",而是"**这个数我能不能信**"。

能不能信,取决于三件事:

第一,**这个数是怎么产生的**——用的是什么方法,方法有没有经过验证,检测条件有没有偏离。

第二,**这个数有没有被动过手脚**——从仪器输出到最终报告,中间经过了几个人的手,有没有修改记录,修改的原因是什么。

第三,**如果数据有问题,有没有被如实记录和处理**——出现过 OOS 吗?有没有开偏差?偏差调查结论是什么?

这三件事,在中国 NMPA 近年来的技术审评反馈中,被反复提及的频率越来越高。CDE 在 2024 年发布的多份技术指导原则里,明确要求申报企业提供**数据可溯源性声明**,并在现场核查中重点检查原始数据与申报数据的一致性。

**监管趋势已经非常清晰:光有数据不够,要有证明数据的证据链。**

---

## **一条证据链,究竟能改变什么?**

我们不妨用一个具体的场景来说明。

某创新药企正在准备 IND 申报,CMC 模块中有一批关键的 HPLC 纯度数据,共涉及 6 个批次、3 个时间点、2 套检测方法。按照传统做法,整理这些数据需要:分析员从 CDS 里导出 18 份 Excel 结果表,逐份核对后手工汇总进批分析总结;QA 核查时需要逐份比对原始图谱和汇总表,确认数值一致、方法版本正确、检测日期合理。

这个过程,保守估计需要一个有经验的 QA 花费 3 到 5 个工作日。如果发现问题,还要追溯到分析员重新确认,再加 1 到 2 天。

现在换一种方式。

每一批次的检测任务在下达时,就已经锁定了样品批号、方法版本和判断标准。分析员完成检测后,直接上传仪器导出的结果表,系统自动提取关键数值,不需要手工填写任何数字。批分析总结由系统自动生成,每一个数值背后都挂着它来自哪份文件的哪个单元格。

QA 打开这份总结,点击任意一个数值,3 秒内就能看到:原始文件、检测日期、执行人、复核人、有没有发生过文件替换、替换原因是什么。全部一屏呈现,不需要跨系统查询,不需要打电话问分析员。

**3 到 5 个工作日,变成了 3 秒。**

这不是技术噱头。这是对研发资源的重新分配——把人从机械的核对工作中解放出来,去做真正需要人类判断的事情。

---

## **证据链对研发进度的影响,比你想象的更深远**

很多研发高管在听到"数据追溯"时,第一反应是"这是 QA 的事"。

这个认知需要更新。

**数据追溯能力,直接影响研发决策的速度。**

当课题负责人在讨论工艺优化方案时,需要快速调取过去 6 个月所有相关批次的纯度趋势数据。如果数据散落在各个分析员的本地文件夹里,这个调取过程可能需要 2 天。如果有完整的证据链系统,这个过程是 10 分钟。

2 天和 10 分钟的差距,在工艺开发阶段可能意味着一个迭代周期的延误。在申报冲刺阶段,可能直接影响 IND 递交的窗口期。

**数据追溯能力,直接决定现场核查的通过率。**

NMPA 的现场核查,最常见的问题之一就是"申报数据与原始记录不一致"。不一致的原因,很多时候不是造假,而是数据搬运过程中的笔误或版本混淆。但在核查现场,你没有时间去解释这是笔误——你只有时间拿出证据。

有证据链的企业,在核查现场能做到:审评官指出任意一个数据疑点,5 分钟内给出完整的溯源记录。没有证据链的企业,往往只能请求"给我们一天时间去查一查"。

**这两种状态,核查结论会截然不同。**

---

## **新药研发,本质上是一场信任的建立**

从第一个化合物筛选,到最终拿到上市批件,整个过程的本质,是药企在向监管机构、向医生、向患者,逐步建立信任。

每一份严谨的分析报告,每一条清晰的数据来源,每一个有迹可查的修改记录,都是信任的砖块。

反过来,每一个说不清来源的数据,每一份找不到底层原始记录的报告,都是在这座信任大厦上凿洞。洞凿得越多,申报越难,核查越险,上市越慢。

**CMC 分析数据核对与追溯助手**,做的事情说穿了只有一件:**帮药企把这些砖块,一块一块、严丝合缝地砌好,让任何人在任何时候,都能清楚地看到这座大厦是怎么建起来的。**

当申报材料里的每一个数字都坚如磐石,当审评官的每一个疑问都能在 30 秒内得到有证据支撑的回答,新药上市的步伐,自然会走得更稳、更快。

---