Python机器学习：线性回归（梯度下降法得最优解）

本文链接：https://blog.youkuaiyun.com/weixin_43818177/article/details/106456271

Python机器学习：线性回归

一、线性回归及梯度下降

看到线性回归，我首先想到的是高中算那个线性回归题，一节课只算出一个k，而且数据规模只有几组而已。

可如今，“大人时代变了”

关于什么是机器学习，我就暂且不做笔记了，网上介绍远比我介绍的清楚。我看的是周志华的西瓜书，疫情原因不得返校，有些数学知识不得细细咀嚼，实在是颇有遗憾。

步入正题，线性回归：

线性回归简单来说就是用一条曲线，来预测未知的可能的值。不知准确？

求得theta0、1最初的办法是利用最小二乘法，求得欧氏几何最小的闭式解。
在这里插入图片描述
梯度下降优化算法：

为了求得更好的theta1，与theta0，我们需要求得损失函数w = (theta1,theta0)
在这里插入图片描述
通过求的的theta1、theta0的偏导，计算出梯度下降;

其中α是学习域，代表每次梯度下降的步长。

二、代码演示

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

"""
the linear regression model for machine study
f(x) = theta_1 * x + theta_0
"""

def ReadingDataSets():
    Datainputstream = np.array(pd.read_csv(r"D:\桌面\data.csv")) # 读取文件
    DataX = Datainputstream[:, 0: -1].ravel() # 将数据传入到各自的维度中
    DataY = Datainputstream[:, -1]
    DataSetShape = Datainputstream.shape # 获取数据规模
    return DataX, DataY, DataSetShape

def average(sets): # 计算平均值
    aver = sum(sets) / np.array(sets).shape[0]
    return aver

def ParameterSolve(x,y,m):#求取y = theta_1 * x + theta_0
    # 为了计算最小的欧氏距离，采用求偏导，计算出各个theta的最优解闭式
    theta_1, theta_0 = 0, 0#赋初值
    parameter_1