【带你快速了解人工智能开发Pandas基础课程第七周】

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


前言

提示:这里可以添加本文要记录的大概内容:

例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。


#博学谷IT学习技术支持#

一、机器学习分类

目标:
掌握什么是监督学习
掌握什么是无监督学习
了解什么是半监督学习
了解什么是强化学习

二、监督学习

监督学习指的是人们给机器一大堆标记好的数据,比如:
1.一大堆照片,标记出哪些是猫的照片,哪些是狗的照片
2.让机器自己学习归纳出算法或模型
3.使用该算法或模型判断出其他没有标记的照片是否是猫或狗

1.1 分类问题¶
分类是监督学习的一个核心问题 。在监督学习中:

当输出变量Y取有限个离散值时,预测问题便成了分类问题
监督学习从数据中学习一个分类模型或分类决策函数,称为分类器(classifer)
分类器对新的输入进行输出的预测(prediction),称为分类(classification)
分类问题包括学习和分类的两个过程:

在学习过程中,根据已知的训练数据集利用有效的学习方法学习一个分类器
在分类的过程中,利用学习的分类器对新的输入实例进行分类。
分类问题的典型应用场景如垃圾邮件识别就是一个2分类问题,使用相应的机器学习算法判定邮件属于垃圾邮件还是非垃圾邮件。

给出了30个训练样本集实例:15个样本为负类别(negative class,圆圈表示),15个样本为正类别(positive class,加号表示)
数据集是二维的,这意味着每个样本都有两个与其相关的值
通过监督学习算法获得一条规则,并将其表示为图中的一条黑色的虚线将两类样本分开,并且可以根据 值将新样本划分到某个类别中(看位于直线的那一侧)。

输出变量为有限个离散值的情况称为分类问题(classification)
如果类别为正类或负类的时候,这个是一个二分类问题

三、回归问题

1.2
另一类监督学习方法针对连续型输出变量进行预测,也就是所谓的回归分析(regression analysis)。回归分析中,数据中会给出大量的自变量和相应的连续因变量(对应输出结果),通过尝试寻找自变量和因变量的关系,就能够预测输出变量。

比如生活中常见的房价问题:

横轴代表房屋面积,纵轴代表房屋的售价
我们可以画出图示中的数据点,再根据使得各点到直线的距离的平均平方距离的最小,从而绘制出下图的拟合直线
根据生活常识随着房屋面积的增加,房价也会增长
回归问题的分类有:

根据输入变量的个数分为一元回归和多元回归
按照输入变量和输出变量之间的关系分为线性回归和非线性回归

总结

以上就是今天要讲的内容,本文仅仅简单介绍了的分类

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

あいうえおらりるれろわをん

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值