Datawhale–李宏毅老师机器学习P1-P2学习笔记
学习笔记
本文是李宏毅老师B站–《机器学习》课程的学习笔记,在此非常感谢DataWhale提供的平台,希望大家加入到这个学习的大家庭中,共同成长。
本文主要是关于机器学习的介绍,在老师的讲解基础上总结而来。
机器学习的起源
在上世纪50年代,人工智能的概念开始兴起,当时人们希望机器具有人的智慧,从而实现代替人执行繁杂的工作。各种科幻小说、科幻电影也日益发展,是人们对美好未来的向往。机器学习,即是利用机器学习人的经验、智慧。
人工智能和机器学习是一对相互依存的概念,人工智能是人们对未来的设想,是想要达到的目标和结果,而机器学习是达到这种结果的方式和方法。深度学习和机器学习是一种被包含和包含的关系,深度学习利用精心设计的神经网络去学习知识,并利用学到的知识,机器学习的很多理念和方法都可以在深度学习中找到其身影。
机器学习的三个步骤
- 定义一个函数集,即设定一堆函数,机器学习的目的是从这个函数集中寻找一个最优的函数
- 评估函数集合,设定评价标准,以根据函数的表现,来评价函数的泛化性能,通常是看训练集在评价函数上的表现
- 选择一个函数,通常选择使训练集表现最好的函数作为最终的函数,这个函数即通过机器学习到的知识和经验
模型的最终效果一般在测试集上进行,此为模型的泛化能力。
机器学习的技术
1.监督学习,包括分类问题和回归问题,分类问题又可以分为二分类和多分类问题(类别数≥3),用到的模型包括线性模型,和非线性模型(深度学习、SVM、KNN,DT等)
2.半监督学习,当部分样本的标签未给出时,此时为半监督学习,值得一提的是,迁移学习是半监督学习方法的一种
3.无监督学习,此数据特点是样本没有标签,模型通过学习,创造一些新的东西。一个典型的无监督学习的例子是强化学习(reinforcement learning),模型会根据最终的反馈,不断迭代策略,以达到最优的效果,其训练过程只涉及最后的结果的得分高低,在学习过程中没有数据标签的参与,因而是无监督学习。
参考文献及视频链接
B站19版视频链接: https://www.bilibili.com/video/BV1Ht411g7Ef.
datawhale学习文档: https://datawhalechina.github.io/leeml-notes/#/chapter1/chapter1.