BMJ最新论文解读:如何利用倾向得分方法完美实现组间均衡可比
源自风暴统计网:一键统计分析与绘图的网站
由于神经发育障碍(NDDs)需要长达数年的随访才能确诊,传统前瞻性研究在样本量上往往受限。
2026年3月11日,外国学者在医学顶刊《BMJ》(医学一区top,IF=42.7)发表了一项队列研究,整合了两个大型美国医疗数据库,评估产前暴露于特定抗惊厥药物是否会增加儿童患神经发育障碍的风险。
该研究主要采用倾向性评分重叠加权法控制混杂因素,以未用药的癫痫女性为参照,分析了10种抗惊厥药物。
为什么使用重叠加权?
首先来看数据来源。该研究整合了美国两大医疗数据库MAX/TAF(公共医保)和MarketScan(商业医保),构建了包含23,880名由患癫痫的女性所生的儿童队列,并分为两组:
暴露组(14,993名):母亲在妊娠后半期至少服用一种抗惊厥药物。
对照组(8,887名):母亲在孕前3个月至分娩期间未使用任何抗惊厥药物。
其中,MAX/TAF提供了7,245名对照和10,345名暴露;MarketScan提供了1,642名对照和4,648名暴露。
由于公共医保与商业医保人群在社会经济地位、病情严重程度及共病情况上存在天然差异,导致暴露组与对照组在基线特征上也存在显著差异。
若直接比较两组儿童的神经发育障碍(NDD)发病率,将无法区分风险究竟是源于药物暴露本身,还是源于人群本身的基线特征差异。
这正是观察性研究的核心局限:混杂偏倚。
目前控制混杂偏倚方法很多,回归控制混杂偏倚,倾向性得分方法也可以控制混杂偏倚,为何这篇文章选中了倾向性得分方法中的重叠加权?
重叠加权
重叠加权(OW)被誉为最强倾向性得分方法,旨在模拟随机临床试验(RCT)的重要属性:临床相关的目标人群、协变量均衡和精确度,能够实现暴露组与对照组的精确平衡,控制混杂偏倚。
JAMA:重叠加权法—最强倾向性得分方法,你可知道?
那么,本文研究团队是如何开展重叠加权控制混杂的呢?
第一步,计算倾向性得分
研究团队将两组队列进行合并,并将“数据来源”作为二分类变量结合预设的协变量一同纳入逻辑回归模型,用于计算倾向性得分(PS)。
预设的协变量包括:个人特征、母亲心理健康或发育状况、医疗保健使用标志、药物使用、其他处方药物暴露以及其他共病。
第二步,计算权重
通过赋予那些不太可能接受治疗却接受了的暴露组患者,以及很可能接受治疗却未接受的对照组患者更大的权重,最大程度模拟随机对照试验,具体来说:
暴露组的重叠权重=1-PS;
对照组的患者的重叠权重=PS。
第三步,检查加权效果
研究团队使用标准化平均差异(SMD)比较了暴露组和参考组之间的患者特征,当SMD<0.1时认为达到平衡。
从下图中可以看出,重叠加权前大部分变量在组间并不平衡,但在加权后,所有纳入倾向评分模型的协变量实现完美平衡(SMD=0)。
本文的结果也恰恰证明了重叠加权的优势!
主要研究结果
在经重叠加权校正的人群中,研究团队利用Cox模型计算了调整后风险比(aHR)。研究结果显示,
丙戊酸和唑尼沙胺与多种神经发育障碍结局显著相关(aHR范围 1.26-4.50);
而左乙拉西坦和苯妥英未发现与任何结局的风险增加相关;
卡马西平和奥卡西平则表现出对 ADHD 及行为障碍的适度风险升高(aHR 1.23–1.40);
尽管托吡酯和拉莫三嗪在大多数结局中未见显著关联,但两者均显示出智力残疾的潜在风险信号,托吡酯还提示了学习困难的风险(aHR 1.23)。
由于智力残疾病例稀缺,这部分风险评估的精确度受限(表现为 2-4 倍的风险增幅但置信区间较宽)。
研究团队进行了多项敏感性与安全性分析,结果与主要分析结果一致,说明研究结果稳健。
最后,在剂量分析中,研究团队以每日处方剂量的中位数为界,将暴露分为高剂量组和低剂量组。结果显示,观察到的关联存在剂量-反应关系,高剂量组风险估计值普遍高于低剂量组。
对于智力障碍,由于事件数过少,无法得出剂量-反应关系的明确结论。
综上所述,本研究通过重叠加权法控制混杂因素,证实丙戊酸与多种神经发育障碍风险增加相关,进一步强化了避免孕期使用的建议。其余药物虽展示出类似的信号,但其中的关联还需进一步评估。
重叠加权老郑已经推荐过很多次了,诸位在研究中可以考虑使用它来控制混杂因素,是个不错的方法!
最后,在文末给郑老师我们团队打个广告吧,大家不要见怪哈!
我们将提供专业的统计分析服务哦!
