基础概念
- 线性回归是很常见的一种回归,线性回归可以用来预测或者分类,主要解决线性问题。
- 线性回归过程主要解决的就是如何通过样本来获取最佳的拟合线。最常用的方法便是最小二乘法,它是一种数学优化技术,它通过最小化误差的平方和寻找数据的最佳函数匹配。
- “最小二乘法”的核心就是保证所有数据偏差的平方和最小。(“平方”的在古时侯的称谓为“二乘”)
“最小二乘法”数学推导
数据集
这里的数据采用Scikit-Learn库中的糖尿病数据集.
代码实现
- 模块导入
import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets, linear_model
from sklearn.metrics import mean_squared_error, r2_score
- 加载数据
diabetes = datasets.load_diabet