14 具有交互项的回归模型
14.1 简介
在回归模型中,除了考虑单个预测变量对响应变量的影响外,还可以考虑预测变量之间的交互作用。这些交互作用项能够捕捉到一个预测变量对另一个预测变量影响的调节作用,从而提供对数据更深刻的理解。
14.2 交互项的定义
假设我们有两个预测变量 X1和 X2,如果我们怀疑它们之间存在交互作用,那么可以在回归模型中加入一个交互项 X1*X2。这个交互项表示 X1 和 X2的乘积,用来捕捉它们的共同影响。
在Python中,可以使用scikit-learn
的PolynomialFeatures
类来生成交互项。
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
# 生成模拟数据
import numpy as np
np.random.seed(42)
X = np.random.rand(100, 2)
y = 3 * X[:, 0] + 5 * X[:, 1] + 7 * X[:, 0] * X[:, 1] + np.ran