机器学习定义
机器学习教父Tom Mitchell:
一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P评判,程序在处理T时的性能有所提升。
机器学习概述
机器学习的核心思想是创造一种算法,它能从数据中挖掘出有规律的东西,而不需要针对某个问题去写代码。你需要做的只是把数据“投喂”给这个算法,然后它会在数据上建立自己的逻辑。最基本的机器学习算法是解决分类和回归两大类问题。
机器学习发展历程
机器学习分类
按机器学习算法学习方式可划分为监督学习、非监督学习、半监督学习、强化学习。
(1)监督学习
监督学习的主要特性是使用大量有标签的训练数据来建立模型,以预测新的未知标签数据。用来指导模型建立的标签可以是类别数据、连续数据等。相应的。如果标签是可以分类的,如0~9手写数字的识别、判断是否为垃圾邮件等,则称这样的有监督学习为分类,如果标签是连续的数据,如身高、年龄、商品的价格等,则称其为回归。
(2)非监督学习
无监督学习和监督学习的主要区别在于无监督学习不需要提前知道数据集的类别标签。无监督学习算法使用的场景通常为聚类和降维,如使用K-均值聚类、系统聚类、密度聚类等算法进行数据聚类,使用主成分分析、