- 🍨 本文为🔗365天深度学习训练营中的学习记录博客
- 🍖 原作者:K同学啊
1. 简单线性回归模型
一、概念
1. 回归:
- 在机器学习中,回归任务是指预测连续值的问题,例如房价、温度、销售额等。
- 回归模型通过学习输入特征(自变量)与输出目标(因变量)之间的关系来进行预测。
- 常见的回归算法包括线性回归、多项式回归、决策树回归、支持向量回归(SVR)和神经网络回归等。
2. 线性回归:
- 线性回归是最简单的回归分析形式,它假设自变量和因变量之间存在线性关系。
- 线性回归的目标是找到一条直线(在二维空间中)或一个平面(在三维空间中),最好地拟合数据集中的点。
- 这条直线(或平面)被称为回归线,它由截距(intercept)和斜率(slope)参数定义。
3. 回归与分类的区别:
- 在机器学习中,回归和分类是两种不同的任务。
- 分类任务是预测离散标签的问题,例如判断邮件是否为垃圾邮件、图片中是否包含某种物体等。
- 回归任务则是预测连续值的问题,如房价、温度、时间序列数据等。
二、代码学习
我的环境:
- 语言环境:cuda环境 Python 3.12.3
- 编译器:Jupyter Lab
这里我们采用“学习时长-成绩”数据集,采用LinearRegression简单线形回归模型,通过学习时长去预测学生成绩。
1. 数据预处理 (导入数据 + 数据集划分)
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
dataset = pd.read_csv("C:\\Users\\Zhao\\Desktop\\data\\studentscores.csv")
X = dataset.iloc[ : , :1].values
Y = dataset.iloc[ : ,1].values
from sklearn.model_selection import train_test_split
X_tra