因果关系中的结构、分离与估计
一、基本结构的数据特征与回归分析
1.1 不同结构数据集的生成与特征
在因果关系的研究中,我们首先关注三种基本的条件独立结构:链(chains)、叉(forks)和对撞器(colliders)。通过生成相应的数据集,我们可以观察它们的特征。
对于链和叉结构的数据集,虽然在细节上可能因独立噪声变量的不同而有所差异,但整体模式较为相似。而对撞器结构的数据集则呈现出不同的特征。以下是生成对撞器数据集的代码:
import numpy as np
N_SAMPLES = 1000 # 假设样本数量为1000
NOISE_LEVEL = 0.1 # 噪声水平
a = np.random.randn(N_SAMPLES)
c = np.random.randn(N_SAMPLES)
b = a + c + NOISE_LEVEL*np.random.randn(N_SAMPLES)
从生成的数据可以看出,对撞器结构中,变量 (a) 和 (b)、(b) 和 (c) 之间的关系更具噪声,且 (A) 和 (C) 之间似乎没有相关性,这与对撞器的性质相符。
1.2 回归模型拟合与结果分析
接下来,我们对生成的三种数据集(链、叉、对撞器)进行多元线性回归分析,以 (C) 为因变量,(A) 和 (B) 为自变量。以下是拟合回归模型的代码:
import pandas as pd
import statsmodels.ap
超级会员免费看
订阅专栏 解锁全文
1134

被折叠的 条评论
为什么被折叠?



