一、什么是机器学习?
两个定义:
- 计算机不需要明确的程序而是自主的去学习
一种旧的传统的定义
- 一个计算机程序能够从经验E中学习(学习任务是T,学习的表现用P衡量),如果这个程序在任务T与表现衡量P 下,可以通过经验E得到改进。
- ##### 举例——西洋棋游戏:
- E=玩了许多局游戏的经验
- T=玩西洋棋的任务
- P=下局游戏程序会赢的概率
- ##### 举例——西洋棋游戏:
二、监督学习
- 定义:给出一个算法,需要全部数据集已经都答案(就是分类标签),然后通过这些数据训练,可以计算出一个新数据的正确分类。
- 分类是预测出一个离散值的输出,回归是预测一个连续性的
三、无监督学习
- 定义:无监督的学习只知道少量或者完全没有结果信息(也就是分类标签),我们可以在不知道变量的情况下获得数据的结构。其实就是在不知道所有样本的分类标签的情况下,利用无监督的学习处理数据,数据形成分类
- 举例:收集1000000个基因数据的集合,然后使用一种方法自动的把它们分成不同的类别,比如一些是比较小的,一些和寿命有关等等
四、建立模型
一些常用的符号表示
- x(i) 输入特征,就是样本的属性值,比如身高,体重,用 X表示输入向量
-
-