机器学习(一)与线性回归

本文介绍了监督学习与无监督学习的区别,强调监督学习的分类特性与无监督学习的聚类核心。通过线性回归分析历年双十一成交额,展示了数据的线性趋势。并使用Python的matplotlib库绘制了成交额与年份的关系图,直观地呈现了数据分布。

监督学习

监督学习,就是常说的分类,通过已有的训练样本(即已知数据以及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优则表示在某个评价准则下是最佳的),再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的,也就具有了对未知数据进行分类的能力。监督学习里典型的例子就是KNN、SVM。

无监督学习

无监督学习,就是去对原始资料进行分类,以便了解资料内部结构。无监督式学习网络在学习时并不知道其分类结果是否正确。无监督学习里典型的例子就是聚类。


区分监督学习与无监督学习:

①监督学习中的数据中是提前做好了分类信息的,必须要有训练集与测试样本;

无监督学习没有训练集,只有一组数据。

②有监督的核心是分类,无监督的核心是聚类。

③有监督学习的方法就是识别事物,会给数据加上标签;

无监督学习方法只有要分析的数据集的本身,数据没有被加上标签。


线性回归

什么是线性回归:

线性回归就是一种x和y之间的关系为线性关系的回归分析。

先行关系用公式表达为:y = a 1 x 1 + a 2 x 2 + b

一元线性回归自然就是一个变量X啦。公式为:y=ax+b

线性回归的目标是,找到一组a和b,使得ε最小。(ε就是误差,也就是学过的正态分布。)

用图像来表示,就是可以用一条直线把图中所有的点均匀的分布于两侧。

以一个题为例:给出历年的双十一成交额,years = [2015, 2016, 2017, 2018, 2019,2020]
turs = [52, 191, 350, 571, 912, 1027],做一个图表。

import matplotlib.pyplot as plt
import numpy as np
from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['Microsoft YaHei']
mpl.rcParams['axes.unicode_minus'] = False
years = [2015, 2016, 2017, 2018, 2019,2020]
turs = [52, 191, 350, 571, 912, 1027]
plt.scatter(years, turs,c='b',s=50)
plt.xlabel("年份", fontsize=15)
plt.ylabel("成交额", fontsize=15)
plt.title("历年双11成交额", fontsize=15)
plt.show()

运行成功后图片为:

 

所以,本题的线性回归线大致如图所示:

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值