Python机器学习:线性回归
一、线性回归及梯度下降
看到线性回归,我首先想到的是高中算那个线性回归题,一节课只算出一个k,而且数据规模只有几组而已。
可如今,“大人时代变了”
关于什么是机器学习,我就暂且不做笔记了,网上介绍远比我介绍的清楚。我看的是周志华的西瓜书,疫情原因不得返校,有些数学知识不得细细咀嚼,实在是颇有遗憾。
步入正题,线性回归:
线性回归简单来说就是用一条曲线,来预测未知的可能的值。不知准确?
求得theta0、1最初的办法是利用最小二乘法,求得欧氏几何最小的闭式解。
梯度下降优化算法:
为了求得更好的theta1,与theta0,我们需要求得损失函数w = (theta1,theta0)
通过求的的theta1、theta0的偏导,计算出梯度下降;
其中α是学习域,代表每次梯度下降的步长。
二、代码演示
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
"""
the linear regression model for machine study
f(x) = theta_1 * x + theta_0
"""
def ReadingDataSets():
Datainputstream = np.array(pd.read_csv(r"D:\桌面\data.csv")) # 读取文件
DataX = Datainputstream[:, 0: -1].ravel() # 将数据传入到各自的维度中
DataY = Datainputstream[:, -1]
DataSetShape = Datainputstream.shape # 获取数据规模
return DataX, DataY, DataSetShape
def average(sets): # 计算平均值
aver = sum(sets) / np.array(sets).shape[0]
return aver
def ParameterSolve(x,y,m):#求取y = theta_1 * x + theta_0
# 为了计算最小的欧氏距离,采用求偏导,计算出各个theta的最优解闭式
theta_1, theta_0 = 0, 0#赋初值
parameter_1