1.机器学习
(1)概念:多领域交叉学科,涉及概率论,统计学,逼近论,凸分析,算法复杂度理论等多门学科。专门研究计算机怎样模拟和实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
(2)学科定位:人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能各个领域,它主要使用归纳、综合,而不是演绎。
(3)定义:探究和开发一系列算法来如何使计算机不需要外部明显的指示,而可以自己通过数据来学习,建模,并且利用建好的模型和新的输入来进行预测的学科。
(4)学习:针对经验E(experience)和一系列的任务T(task)和一定表现的衡量P,如果随之经验E的积累,针对定义好的任务T可以提高P,就说计算机具有学习能力。例如:下棋,语音识别,自动驾驶。
2.机器学习的应用
语音识别
自动驾驶
语言翻译
计算机视觉
推荐系统
无人机
识别垃圾邮件
3.深度学习
(1).深度学习概念
深度学习是基于机器学习延伸出来的一个新的领域,由以人大脑结构为启发的神经网络算法为起源加之模型结构深度的增加发展,并伴随大数据和计算能力的提高而产生的一系列新的算法。
(2)深度学习的发展
其概念由著名科学家Geoffrey Hinton等人在2006年和2007年在《Science》等上发表的文章被提出和兴起。
(3)深度学习应用
深度学习,作为机器学习中延伸出来的一个领域,被应用在图像处理与计算机视觉,自然语言处理以及语音识别等领域。自2006年至今,学术界和工业界合作在深度学习方面的研究与应用在以上领域取得了突破性的进展。以ImageNet为数据库的经典图像中的物体识别竞赛为例,击败了所有传统算法,取得了前所未有的精确度。
(4)深度学习比较前沿的学术机构和公司
学校以多伦多大学,纽约大学,斯坦福大学为代表,工业界以Google,Facebook,和百度为代表走在深度学习研究与应用的前沿。Google挖走了Hinton,Facebook挖走了LeCun,百度硅谷的实验室挖走了Andrew Ng,Goole以超过5亿美金收购了专门研究深度学习的初创公司DeepMind,深度学习方因技术的发展与人才的稀有造成的人才抢夺战达到了前所未有的激烈程度。诸多大大小小(如阿里巴巴,雅虎)等公司也都在跟进,开始涉足深度学习领域,深度学习人才需求量会持续快速增长。
4.基本概念:训练集,测试集,特征值,监督学习,非监督学习,分类,回归
5.概念学习:概念学习是指从有关某个布尔函数的输入输出训练阳历中推断出该布尔函数。
6.概念定义在实例集合之上,这个集合表示为X。待学习的概念或目标函数成为目标概念,记做C。
x:每一个实例
X: 样例,所有实例的集合。
学习目标:f:X→Y
7.训练集:用来进行训练,也就是产生模型或者算法的数据集。
测试集:用来专门进行测试已经学习好的模型或者算法的数据集。
特征向量:属性的集合,通常用一个向量来表示,附属于一个实例。
标记:实例类别的标记
正例
反例
8.分类:目标标记为类别型数据。
回归:目标标记为连续性数值。
9.有监督学习:训练集有类别标记。
无监督学习:无类别标记。
半监督学习:有类别标记的训练集+无类别标记的训练集。
10.机器学习步骤框架
(1).把数据拆分成训练集和测试集。
(2).用训练集和训练集的特征向量训练算法。
(3).用学习来的算法运用在测试集上评估算法。