因果机器学习(Causal Machine Learning, CausalML)是将因果推断与机器学习相结合的前沿技术,旨在通过建立因果关系模型,深入探索数据背后的深层联系,从而更准确地预测和决策。
我还整理出了相关的论文+开源代码,以下是精选部分论文
更多论文资料可以关注
:AI科技探寻领取相关[论文+开源码】
论文1
标题:
【Nature子刊】
Causal machine learning for predicting treatment outcomes
用于预测治疗结果的因果机器学习
方法:
-
因果机器学习(Causal ML):提出了一种用于预测治疗结果(包括疗效和毒性)的因果机器学习方法,支持药物评估和患者护理的个性化。
-
个体化治疗效应估计:通过估计个体化治疗效应(CATE),使临床决策能够根据患者个体特征进行个性化调整。
-
多模态数据处理:能够处理包含图像、文本、时间序列以及遗传数据的多模态数据集,从而从复杂数据中估计治疗效应。
创新点:
-
个体化治疗效应估计:通过估计个体化治疗效应(CATE),为患者提供更精准的治疗预测,与传统统计方法相比,能够更好地捕捉治疗效应的异质性。
-
多模态数据支持:能够处理包含多种数据类型的多模态数据集,例如从电子健康记录或医学影像中估计治疗效应,扩展了因果机器学习的应用范围。
-
临床决策支持:通过预测不同治疗方案下的潜在患者结果,为临床医生提供决策支持,帮助选择最佳治疗方案,显著提高了治疗决策的科学性和个性化程度。
-
理论与实践结合:结合了因果推断的理论基础和机器学习的灵活性,为处理复杂的临床数据提供了新的工具,推动了因果机器学习在医学领域的应用。

论文2
标题:
【Nature子刊】
Improving the accuracy of medical diagnosis with causal machine learning
通过因果机器学习提高医疗诊断的准确性
方法:
-
反事实推理:将诊断重新定义为反事实推理任务,通过计算疾病对症状的因果解释能力来改进传统关联性诊断方法。
-
期望禁用度和期望充分性:提出了两种反事实诊断度量——期望禁用度和期望充分性,用于量化疾病对症状的因果影响。
创新点:
-
反事实诊断方法:与传统关联性诊断方法相比,反事实诊断算法在测试集上将真实疾病排名更高的比例从21%提升至32%,显著提高了诊断准确性。
-
罕见病诊断改进:在罕见病和非常罕见病的诊断中,反事实算法将真实疾病排名更高的比例分别从29.2%提升至32.9%,减少了罕见病误诊的可能性。
-
与医生的比较:反事实算法的平均诊断准确率达到77.26%,高于医生的平均准确率(71.4%)和传统关联性算法(72.52%),进入医生群体的前25%,达到专家级临床水平。
-
模型兼容性:反事实算法能够在不改变现有疾病模型的情况下,直接应用于现有的贝叶斯诊断模型,提供即时升级路径,无需重新学习疾病模型。

论文3
标题:
Causal Discovery in Semi-Stationary Time Series
半平稳时间序列中的因果发现
方法:
-
PCMCI:提出了一种基于约束的非参数算法PCMCI,用于在半平稳时间序列中发现因果关系。该算法通过捕捉因果机制的交替和周期性变化,识别底层因果图。
-
时间分割与条件独立性测试:通过时间分割和条件独立性测试,PCMCI能够识别时间序列中周期性变化的因果结构。
-
马尔可夫链构造:通过构造与半平稳结构因果模型(SCM)紧密相关的马尔可夫链,PCMCI能够利用其平稳性和遍历性来估计条件分布。
-
周期性估计:通过最小化估计的父集大小来选择最优的周期性估计值,从而准确识别每个变量的周期性。
创新点:
-
半平稳时间序列因果发现:首次提出了一种能够处理半平稳时间序列的因果发现算法,解决了传统方法在非平稳数据上失效的问题。
-
周期性因果机制捕捉:算法能够自动识别时间序列中因果机制的周期性变化,准确率在模拟数据上达到90%以上(当时间序列长度T足够大时)。
-
非参数方法:PCMCI不依赖于数据的具体分布假设,使其适用于更广泛的时间序列数据类型。
-
理论保证:在无限样本极限下,PCMCI能够准确恢复因果图,为因果发现提供了坚实的理论基础

论文4
标题:
Robust and Agnostic Learning of Conditional Distributional Treatment Effect
条件分布处理效应的鲁棒且不可知的学习
方法:
-
伪结果回归:提出了一种基于伪结果的回归方法,通过构造特殊的伪结果并使用任何回归学习器对其进行回归,从而学习条件分布处理效应(CDTE)。
-
模型不可知性:该方法能够提供CDTE在回归模型类上的最佳投影,即使回归器不是通用逼近器,也能获得最佳近似。
-
鲁棒性:即使在非参数学习中以非常慢的速率学习到的干扰项,仍能以依赖于模型复杂度的速率学习CDTE,并可对线性投影的CDTE进行有效推断。
创新点:
-
鲁棒性提升:与插值方法相比,该方法在学习CDTE时对模型误设和慢速学习的鲁棒性显著提高,误差依赖于干扰项误差的平方,从而在实际应用中更加稳定。
-
模型不可知性:能够为CDTE提供模型不可知的最佳近似,即使在使用线性回归等简单模型时,也能获得与真实CDTE的最佳线性近似,性能提升显著。
-
广泛的分布度量:该方法能够处理包括条件分位数、超分位数和基于f-散度的风险度量在内的广泛分布度量,为研究者提供了更丰富的工具来分析处理效应的异质性。
-
统计推断能力:该方法允许对CDTE的线性投影进行有效的统计推断,使得研究者能够对分布效应异质性进行可解释的分析,覆盖率在模拟数据中达到95%以上。

更多论文资料可以关注
:AI科技探寻领取相关[论文+开源码】
1226

被折叠的 条评论
为什么被折叠?



