岭回归
特征数量比样本数量多的情况
𝑋𝑇𝑋 + 𝜆𝐼 主要做了这部分修改,加上了特征值乘以单位矩阵,使得原始矩阵变成可逆矩阵。求导过程:
使用Longley数据集实现岭回归
import numpy as np
from numpy import genfromtxt
from sklearn import linear_model
import matplotlib.pyplot as plt
# 读入数据
data = genfromtxt(r"longley.csv",delimiter=',')
print(data)
# 切分数据
#特征值为从第一行开始的所有行/从第二列开始的所有列
x_data = data[1:,2:]
#样本值为第一行第一列
y_data = data[1:,1]
print(x_data)