2025Idea黑马因果机器学习!多篇文章轻松登上Nature!32/64

部署运行你感兴趣的模型镜像

因果机器学习(Causal Machine Learning, CausalML)是将因果推断与机器学习相结合的前沿技术,旨在通过建立因果关系模型,深入探索数据背后的深层联系,从而更准确地预测和决策。

我还整理出了相关的论文+开源代码,以下是精选部分论文

 更多论文资料可以关注AI科技探寻领取相关[论文+开源码】

论文1

标题:

【Nature子刊】

Causal machine learning for predicting treatment outcomes

用于预测治疗结果的因果机器学习

法:

  • 因果机器学习(Causal ML):提出了一种用于预测治疗结果(包括疗效和毒性)的因果机器学习方法,支持药物评估和患者护理的个性化。

  • 个体化治疗效应估计:通过估计个体化治疗效应(CATE),使临床决策能够根据患者个体特征进行个性化调整。

  • 多模态数据处理:能够处理包含图像、文本、时间序列以及遗传数据的多模态数据集,从而从复杂数据中估计治疗效应。

创新点:

  • 个体化治疗效应估计:通过估计个体化治疗效应(CATE),为患者提供更精准的治疗预测,与传统统计方法相比,能够更好地捕捉治疗效应的异质性。

  • 多模态数据支持:能够处理包含多种数据类型的多模态数据集,例如从电子健康记录或医学影像中估计治疗效应,扩展了因果机器学习的应用范围。

  • 临床决策支持:通过预测不同治疗方案下的潜在患者结果,为临床医生提供决策支持,帮助选择最佳治疗方案,显著提高了治疗决策的科学性和个性化程度。

  • 理论与实践结合:结合了因果推断的理论基础和机器学习的灵活性,为处理复杂的临床数据提供了新的工具,推动了因果机器学习在医学领域的应用。

image.png

论文2

标题:

【Nature子刊】

Improving the accuracy of medical diagnosis with causal machine learning

通过因果机器学习提高医疗诊断的准确性

法:

  • 反事实推理:将诊断重新定义为反事实推理任务,通过计算疾病对症状的因果解释能力来改进传统关联性诊断方法。

  • 期望禁用度和期望充分性:提出了两种反事实诊断度量——期望禁用度和期望充分性,用于量化疾病对症状的因果影响。

创新点:

  • 反事实诊断方法:与传统关联性诊断方法相比,反事实诊断算法在测试集上将真实疾病排名更高的比例从21%提升至32%,显著提高了诊断准确性。

  • 罕见病诊断改进:在罕见病和非常罕见病的诊断中,反事实算法将真实疾病排名更高的比例分别从29.2%提升至32.9%,减少了罕见病误诊的可能性。

  • 与医生的比较:反事实算法的平均诊断准确率达到77.26%,高于医生的平均准确率(71.4%)和传统关联性算法(72.52%),进入医生群体的前25%,达到专家级临床水平。

  • 模型兼容性:反事实算法能够在不改变现有疾病模型的情况下,直接应用于现有的贝叶斯诊断模型,提供即时升级路径,无需重新学习疾病模型。

image.png

论文3

标题:

Causal Discovery in Semi-Stationary Time Series

半平稳时间序列中的因果发现

方法:

  • PCMCI:提出了一种基于约束的非参数算法PCMCI,用于在半平稳时间序列中发现因果关系。该算法通过捕捉因果机制的交替和周期性变化,识别底层因果图。

  • 时间分割与条件独立性测试:通过时间分割和条件独立性测试,PCMCI能够识别时间序列中周期性变化的因果结构。

  • 马尔可夫链构造:通过构造与半平稳结构因果模型(SCM)紧密相关的马尔可夫链,PCMCI能够利用其平稳性和遍历性来估计条件分布。

  • 周期性估计:通过最小化估计的父集大小来选择最优的周期性估计值,从而准确识别每个变量的周期性。

创新点:

  • 半平稳时间序列因果发现:首次提出了一种能够处理半平稳时间序列的因果发现算法,解决了传统方法在非平稳数据上失效的问题。

  • 周期性因果机制捕捉:算法能够自动识别时间序列中因果机制的周期性变化,准确率在模拟数据上达到90%以上(当时间序列长度T足够大时)。

  • 非参数方法:PCMCI不依赖于数据的具体分布假设,使其适用于更广泛的时间序列数据类型。

  • 理论保证:在无限样本极限下,PCMCI能够准确恢复因果图,为因果发现提供了坚实的理论基础

image.png

论文4

标题:

Robust and Agnostic Learning of Conditional Distributional Treatment Effect

条件分布处理效应的鲁棒且不可知的学习

法:

  • 伪结果回归:提出了一种基于伪结果的回归方法,通过构造特殊的伪结果并使用任何回归学习器对其进行回归,从而学习条件分布处理效应(CDTE)。

  • 模型不可知性:该方法能够提供CDTE在回归模型类上的最佳投影,即使回归器不是通用逼近器,也能获得最佳近似。

  • 鲁棒性:即使在非参数学习中以非常慢的速率学习到的干扰项,仍能以依赖于模型复杂度的速率学习CDTE,并可对线性投影的CDTE进行有效推断。

创新点:

  • 鲁棒性提升:与插值方法相比,该方法在学习CDTE时对模型误设和慢速学习的鲁棒性显著提高,误差依赖于干扰项误差的平方,从而在实际应用中更加稳定。

  • 模型不可知性:能够为CDTE提供模型不可知的最佳近似,即使在使用线性回归等简单模型时,也能获得与真实CDTE的最佳线性近似,性能提升显著。

  • 广泛的分布度量:该方法能够处理包括条件分位数、超分位数和基于f-散度的风险度量在内的广泛分布度量,为研究者提供了更丰富的工具来分析处理效应的异质性。

  • 统计推断能力:该方法允许对CDTE的线性投影进行有效的统计推断,使得研究者能够对分布效应异质性进行可解释的分析,覆盖率在模拟数据中达到95%以上。

image.png

 更多论文资料可以关注AI科技探寻领取相关[论文+开源码】 

您可能感兴趣的与本文相关的镜像

Facefusion

Facefusion

AI应用

FaceFusion是全新一代AI换脸工具,无需安装,一键运行,可以完成去遮挡,高清化,卡通脸一键替换,并且Nvidia/AMD等显卡全平台支持

【干货书】《因果推理导论-机器学习角度》,132页pdf 有几个主要的主题贯穿全书。这些主题主要是对两个不同类别的比较。当你阅读的时候,很重要的一点是你要明白书的不同部分适合什么类别,不适合什么类别。 统计与因果。即使有无限多的数据,我们有时也无法计算一些因果量。相比之下,很多统计是关于在有限样本中解决不确定性的。当给定无限数据时,没有不确定性。然而,关联,一个统计概念,不是因果关系。在因果推理方面还有更多的工作要做,即使在开始使用无限数据之后也是如此。这是激发因果推理的主要区别。我们在这一章已经做了这样的区分,并将在整本书中继续做这样的区分。 识别与评估。因果效应的识别是因果推论所独有的。这是一个有待解决的问题,即使我们有无限的数据。然而,因果推理也与传统统计和机器学习共享估计。我们将主要从识别因果效应(在第2章中,4和6)之前估计因果效应(第7章)。例外是2.5节和节4.6.2,我们进行完整的例子估计给你的整个过程是什么样子。 介入与观察。如果我们能进行干预/实验,因果效应的识别就相对容易了。这很简单,因为我们可以采取我们想要衡量因果效应的行动,并简单地衡量我们采取行动后的效果。观测数据变得更加复杂,因为数据中几乎总是引入混杂。 假设。将会有一个很大的焦点是我们用什么假设来得到我们得到的结果。每个假设都有自己的框来帮助人们注意到它。清晰的假设应该使我们很容易看到对给定的因果分析或因果模型的批评。他们希望,清晰地提出假设将导致对因果关系的更清晰的讨论。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值