摘要
本周学习了李宏毅老师的机器学习基础,通过一个入门案例认识机器学习的本质,函数的输入以及函数的类别有哪些,学习了training的三个步骤,包括简版和复杂版。以及神经网络的结构,深度学习正向传播计算模型的误差值、反向传播可以帮助我们有效的进行渐变迭代计算(帮助计算梯度)。
一、入门案例
机器学习的本质是找一个Function,比如,做一个语音识别文字这个函数的输入就是一段语言,其输出是对这段语音内容的识别;做一个图像识别,如识别图片内容;就是要基于人类的想法实现人类想要的输入、输出的结果。
找的Function不同,机器学习也有不同的类别
-
回归(Regression),函数的输出是一个数值。
例如根据今天的PM2.5,气温以及臭氧的含量预测明天的PM2.5。
-
分类(Classification),人类先准备一些选项(称为类别,class),函数的输出为从前面的选项中选择正确的输出。
例如:用户在收到邮件时,判断这一封邮件是否为垃圾邮件,给出Yes/No,Classification可以又多个类别。
-
结构化学习(Structured Learning) 让机器来创造
二、How to find a function
通过YouTube视频后台用户点击次数的预测为例子简单学习如何找到这个函数
1.Function with Unknown Parameters
首先要找一个带有未知参数的参式,这个Function称为Model,X(特征,feature)是从领域知识(domain knowledge)获取的已知数据,w即weight权重,b为bias.
2.Define Loss from Training Data
Loss也是一个function,输入是上面Model中的w和b,记作L(b,w);该函数的输出的意义是这一组b和w的数值到底好不好。
Traning Data
- step1 选取参数b=500,w=1;
- step2 利用该参数和Model y=b+wx计算出某一天的视频点击量的预测值,计算出预测值跟那一天的实际值(label)做差取绝对值记作e;
- step3 计算出Loss值,Loss的值越小,即预测误差越小,代表当前取的(b,w)参数