传统机器学习方法主要关注变量间的关联关系,难以有效揭示其背后的因果机制。这一局限在复杂应用场景中日益突出,推动学术界积极探索更具解释能力的新型方法,因果机器学习(CausalML)由此成为研究热点。
因果机器学习(CausalML)融合因果推断与机器学习,致力于构建变量间的因果图谱,挖掘数据背后的本质联系,从而提升模型的可解释性与决策可靠性。2024年,该领域的创新主要集中在动态建模、高维数据处理、无监督因果发现及跨域迁移等方面。例如,结合深度学习与稀疏因果图的轻量化混杂控制方法,兼顾模型精度与计算效率,具备广泛应用前景。
作为当前AI与统计学交叉的前沿方向,因果机器学习已在医疗、金融、工程等领域展现出巨大潜力。本文精选20篇最新高水平论文,涵盖理论进展与典型应用,助力研究者快速把握趋势,抢占科研先机。
点击【AI十八式】的主页,获取更多优质资源!
一、On Measuring Intrinsic Causal Attributions in Deep Neural Networks

在这里插入图片描述
方法
本文提出了一种新的框架,旨在量化神经网络模型中的内在因果贡献(ICC)。该框架基于生成模型,首次尝试在神经网络中明确量化这些因果贡献。提出了一种基于蒙特卡洛方法的算法,用于高效估计ICC,结合了随机化准蒙特卡洛(RQMC)采样策略,以提高计算的稳定性和收敛速度。通过多个数据集的实验,验证了所提方法的有效性,并与现有的解释性技术进行了比较,展示了其在模型解释中的潜力。 
创新点
-
多层级信号分解 提出从传感器级别(如加速度计、陀螺仪等)到通道级别(如三轴数据)的分层信号分解方法,首次在WHAR(可穿戴设备人类动作识别)任务中融合这种多层级特征,增强了局部与全局时空关系的捕捉能力。
-
分层交互融合机制 通过层次化融合策略,在多个层级中动态建立传感器内和传感器间的时空依赖关系,弥补了现有方法对复杂时空耦合建模的不足。结合分解后的子信号特征,减少冗余信息干扰,同时利用跨层特征互补性提升分类精度。
论文链接:https://arxiv.org/abs/2505.09660
二、CAST: Time-Varying Treatment Effects with Application to Chemotherapy and Radiotherapy on Head and Neck Squamous Cell Carcinoma

在这里插入图片描述
方法
本文提出了一个名为CAST(Causal Analysis for Survival Trajectories)的新框架,通过结合参数和非参数方法,建模治疗效果随时间变化的动态过程。传统的生存分析方法通常在固定时间点上估计治疗效果,无法捕捉治疗效果随时间的动态变化,CAST框架旨在填补这一方法论空白。
CAST结合了因果生存森林的优势,提供了连续时间的治疗效果估计,采用参数化和非参数化技术,能够更细致地理解治疗对患者生存的影响。实验表明,CAST能够揭示治疗效果的上升、峰值和下降过程,为个性化医疗提供了重要的临床见解。 
创新点
-
动态治疗效果建模 传统生存分析方法仅在固定时间点静态估计治疗效果,而CAST框架首次实现了连续时间维度上的动态评估,捕捉治疗效果随时间的上升、峰值和衰减过程。这种动态建模填补了方法学空白,为临床提供更精细的疗效演化视角,而非单一时间点的结论。
-
参数化与非参数化方法的融合
-
因果生存森林(非参数):利用随机森林的灵活性与高维数据处理能力,捕捉复杂非线性关系和个体异质性。
-
参数化模型补充:通过引入参数假设(如时间依赖的风险函数),增强模型在稀疏数据区域的稳定性,避免非参数方法的过拟合风险。
论文链接:http://export.arxiv.org/abs/2505.06367
三、Soft causal learning for generalized molecule property prediction: An environment perspective

在这里插入图片描述
方法
本文提出了一个名为CauEMO的分子属性预测网络,旨在解决分子科学中的OOD(Out-of-Distribution)问题。设计了一个知识增强的环境生成器,以促进环境的多样性,并通过环境-图信息瓶颈(E-GIB)学习目标来提取环境表示,分离无关的环境信号和相关信号。通过引入环境-不变性软因果交互机制,CauEMO能够有效捕捉环境与因果不变性之间的动态交互。
七个数据集上的实验表明,CauEMO在OOD场景下具有良好的泛化能力,能够有效提高模型的表现。 
创新点
-
知识增强的环境生成器 突破传统数据增强对随机扰动的依赖,通过引入化学领域知识(如官能团替换规则、分子骨架变形模板)生成与分子属性逻辑关联的多样化环境,确保生成环境既多样又具有化学合理性。
-
环境-图信息瓶颈(E-GIB)学习目标 首次将信息瓶颈理论扩展至环境因果建模,提出双重约束机制:
-
信息压缩约束:强制环境表示仅保留与分子属性相关的因果特征。
-
解耦约束:分离环境信号中的因果相关(如官能团对药效的影响)与无关分量(如分子构象噪声),提升模型的抗干扰能力。
-
环境-不变性软因果交互机制 提出动态权重分配的软交互框架,通过可学习的门控网络,量化不同环境对因果不变性特征的贡献权重。引入伪因果关系验证模块,自适应调整环境与因果路径的关联强度。
论文链接:https://arxiv.org/abs/2505.06283
点击【AI十八式】的主页,获取更多优质资源!
879

被折叠的 条评论
为什么被折叠?



