当前位置: 首页 > news >正文

方法学革新:工具变量因果森林如何破解因果谜题?

源自风暴统计网:一键统计分析与绘图的网站

最近老郑分享了很多因果推断的前沿方法学推文,今天介绍另一种前沿方法,工具变量因果森林。

2025年11月发表在《International Journal of Epidemiology》(医学二区,IF=5.9)的一项研究,是一篇典型的因果推断研究,采用工具变量因果森林这一前沿机器学习方法,探究退休对认知功能的异质性影响。

下面一起从这篇文章中学习一下这个前沿方法!


研究争议,退休与认知功能的谜题

“我是不是该晚点退休,多动动脑子防痴呆?”这可能是很多人的传统观念,许多临近退休的人都有这样的担忧。

一些研究认为,工作能保持大脑活跃,退休会导致“用进废退”;另一些研究则发现,工作压力可能加速认知衰退,退休反而是解脱。

因此,本研究探讨了退休是否对认知功能有影响?这种影响是否因个体特征和国家背景而异?

研究团队使用了三个国际标准化老龄化调查的三波次数据:HRS(美国健康与退休研究)、ELSA(英国老龄化追踪研究)、SHARE(欧洲健康、老龄化与退休调查)。

研究涵盖三个时间段数据,严格分离暴露、协变量与结局的测量时间点,避免反向因果。

  • 第一波(2014/2015):收集60个基线协变量

  • 第二波(2016/2017):确定退休状态

  • 第三波(2018/2019):评估认知功能结局

研究选择“国家法定退休年龄”作为退休的工具变量,解决退休决策的内生性问题,这让研究者能够区分退休的真正影响,而不是其他混淆因素。”

结局变量:认知功能。情景记忆被用作衡量认知功能的一项指标。情景记忆指的是回忆过去经历的能力,这一能力通常会随着年龄的增长而下降。参与者听到了 10 个常见的单词,并立即由采访者要求他们尽可能多地回忆这些单词。大约 5 分钟后,他们又被要求再次回忆这些单词。因此,他们回忆起的单词总数(范围从 0 到 20 个)代表了他们的情景记忆功能,这与之前的研究结果一致。

方法革新,机器学习破解因果关系难题

研究者比较了使用四种方法估计的平均处理效应(ATE)。

  • 参数化的普通最小二乘法 (OLS)

  • 两阶段最小二乘法 (2SLS)

  • 不含工具变量的非参数因果森林 (non-IV forests)

  • 工具变量因果森林 (IV forests)

对于参数化方法,研究者根据在已训练的工具变量因果森林中的重要性,选择了10个协变量进行调整。

非参数方法的平均处理效应通过残差对残差回归法获得。

✅ 接下来重点讲讲工具变量因果森林方法如何应用的。

1.工具变量因果森林方法将用于工具变量估计的广义矩估计法,与随机森林相结合,以识别相似的处理效应。

2.工具变量因果森林纳入了来自第一波调查的60个经过协调统一的协变量。

3.为了减轻潜在的反向因果关系,纳入了认知功能的基线得分。

4.研究者假设数据为随机缺失,缺失值使用基于随机森林的算法进行填补。

5.训练完成后,由于极端倾向得分会破坏估计的稳定性,所以研究者将分析限制在退休倾向得分介于0.1至0.9之间的7432名个体。相当于排除了那些“无论如何都会退休”和“无论如何都不会退休”的极端人群,专注于那些退休决定可能受到政策影响的人群,使结果更具政策参考价值。

因此,这项研究的工具变量因果森林估计量代表的是重叠人口上的条件局部平均处理效应(CLATO)。

6.随后,将观测值按条件局部平均处理效应从Q1到Q5分为五等分组,并比较了各组间在社会人口学特征、健康与行为以及国家分布上的差异。

7.P值使用Bonferroni方法进行了调整。

8.敏感性分析:进行了多项敏感性分析以确认研究结果的稳健性。这些分析包括:将样本限制在55至75岁之间、排除部分退休的个体、仅分析全职雇员,以及排除样本量最大的美国数据。

退休对认知功能有显著的积极影响

1.整体效应

  • 研究使用最前沿的工具变量因果森林方法估计,退休者比仍在工作者平均能多回忆1.348个单词。

  • 传统的工具变量方法(2SLS)也发现了正向关联(0.962个单词),但效应值小于IV森林的估计。

  • 使用普通最小二乘法(OLS)和非工具变量法的因果森林构建的初步分析未发现退休与认知功能之间存在关联。

  • 工具变量的有效性通过 F 统计量 163.037(P < 0.0001)和Sargan统计量 1.177(P = 0.28)得到证实。

敏感性分析证实了主要发现的可靠性。

2.异质性分析

研究根据“条件局部平均处理效应(CLATO)”将人群分为五组(Q1受益最小,Q5受益最大),发现:

工具变量因果森林在这一研究中的应用,展示了机器学习与因果推断融合的巨大潜力

随着大数据和算法技术的进步,这种数据驱动、灵活捕捉异质性的方法,有望在公共卫生、社会政策等领域发挥更大作用,帮助我们发现更细致、更个性化的因果规律。

因果推断方法要好好学起来了!

参考文献:Sato K, Noguchi H, Inoue K. Heterogeneity in the association between retirement and cognitive function: a machine learning analysis across 19 countries. Int J Epidemiol. 2025 Oct 14;54(6):dyaf201. doi: 10.1093/ije/dyaf201.


最后,在文末给郑老师我们团队打个广告吧,大家不要见怪哈!

我们将提供专业的临床试验项目设计与分析

http://www.jsqmd.com/news/222741/

相关文章:

  • Altium Designer中PCB线宽与电流关系的全面讲解
  • Prudentia Sciences宣布完成由McKesson Ventures领投的A轮融资,加速生命科学交易的尽职调查
  • 电商智能客服:从成本中心到价值中枢的行业转型核心
  • Science最新文章:大型语言模型时代的科学生产
  • 如何在仅持有 IPA 文件的情况下保护 iOS 应用代码安全
  • Qwen2.5-7B模型监控方案:性能与异常实时检测
  • Qwen2.5-7B应用分享:智能编程调试助手开发
  • Qwen2.5-7B版本升级:从旧版迁移的注意事项
  • ITRS收购IP-Label以增强数字体验监测能力并拓展欧洲业务版图
  • 理解PCB铺铜如何改善电路板整体接地性能
  • 面对国自然基金申请,如何撰写一份逻辑清晰且具竞争力的申请书?
  • 一文搞懂机器学习入门知识!
  • Qwen2.5-7B模型架构:技术细节深入剖析
  • Modbus协议工业级脉冲模块,为农业自动化实践保驾护航
  • Qwen2.5-7B角色定制教程:打造专属AI虚拟助手
  • Qwen2.5-7B搜索引擎:智能问答增强实现方案
  • Qwen2.5-7B知识量测试:最新知识覆盖度评估
  • Qwen2.5-7B知识问答系统:企业知识库智能搜索方案
  • Qwen2.5-7B人力资源:简历分析与筛选系统
  • 告别人工调控!工业级可调频脉冲模块守护化工自动化品质
  • 自然对话就准确查找资料,资料小助理—智能知识库
  • Qwen2.5-7B法律咨询:合同分析与条款生成案例
  • Qwen2.5-7B文本相似度:语义匹配优化策略
  • 2023年IEEE TITS SCI2区TOP,增强遗传算法+分布式随机多无人机协同区域搜索路径规划,深度解析+性能实测
  • Qwen2.5-7B机器翻译:高质量多语言转换
  • Qwen2.5-7B代码解释器:理解复杂程序的AI助手
  • 快速理解jScope与后端工具链的协同机制
  • Qwen2.5-7B交互设计:自然对话流优化技巧
  • 温度上升与PCB走线宽度电流关系对照详解
  • 通过蓝牙控制WS2812B灯带:手机端操作指南