吴恩达机器学习1-引入
- 应用领域:
数据挖掘: 搜索引擎等
计算机生物学:基因序列等
自然语言处理:推荐算法等
计算机视觉:手写识别等
- 机器学习的定义:
定义1:
在进行特定编程的情况下,给予计算机学习能力的领域,比如学习下棋。
定义2:
一个程序被认为能从经验 E 中学习,解决任务 T,达到性能度量值P,当且仅当,有了经验 E 后,经过 P 评判,程序在处理 T 时的性能有所提升。
在这里我的理解方式为:
E:样本
T:对样本的处理方式
P:处理的效果或者正确率
- 监督学习:
定义:教计算机如何去完成任务(训练集被标记)
举例:
1.回归问题:给定一组房价和尺寸,通过已有的关系对未知的房价和尺寸进行预测
2.分类问题:给定一组邮件,通过已有的标注判断是否为垃圾邮件
- 无监督学习:
定义:计算机自己进行学习(训练集未被标记)
举例:
聚类问题:给定一组样本,要求对样本进行分类
样本信息是未知的,比如检索成千上万个新闻,对其进行分类成不同的主题
两者的区别是学习过程中使用的训练样本是否含有标记信息