基于斯皮尔曼等级相关系数的线性模型因果方向推理
一、引言
在人工智能领域,因果关系挖掘备受关注。数据科学算法通常更关注相关性,但在很多场景下,相关性并不足以帮助人们做出正确决策,因此深入研究数据中的因果关系十分必要。目前,从观测数据中发现因果关系是多个领域的研究热点。
本文开发了一种基于斯皮尔曼等级相关系数的线性系统因果方向推理算法。该算法使用copula来建模变量间的依赖关系,并估计变量间的斯皮尔曼等级相关系数。在适当假设下,此方法能够识别因果方向,且在处理线性数据时优于现有方法。
二、相关工作
在因果推理中,两个变量间通常存在单向关系,且这种关系往往不可逆。在解决线性系统的因果推理问题时,变量中包含的不对称信息通常比非线性系统少,但线性方法往往能给出更好的结果,因为构建非线性模型通常需要大量样本和较高的时间成本。近年来,已有一些方法被提出用于解决线性因果问题:
- Shimizu等人提出了基于独立成分分析的线性非高斯无环模型,用于发现连续数据的因果结构。
- Hyttinen等人描述了一种识别包含循环和潜在变量的线性模型的过程,给出了因果可识别性的充要条件证明,并提出了一种完全搜索算法。
- Zhang和Luo通过估计等效广义高斯分布参数计算观测数据的熵,并提出了一种基于单位熵的因果推理方法。
- Rothenhäusler等人提出了一种在线性结构方程模型中带有隐藏变量的快速推理方法,并给出了因果参数的可识别性条件和低维情况下的渐近置信区间。
三、因果推理条件描述
假设X和Y是实数集R上的随机变量,线性加性噪声模型如下:
[
\begin{cases
超级会员免费看
订阅专栏 解锁全文
80

被折叠的 条评论
为什么被折叠?



