机器学习内容知识分享主要来自于台湾大学李宏毅教授教授的机器学习课程,其视频链接如下 https://www.youtube.com/@HungyiLeeNTU
1)什么是机器学习
现在随着人工智能的发展,我们多多少少都听过人工智能,机器学习这样的词汇,而其实所谓的人工智能都可以被理解为就是一个函数(function),这个函数的功能强大,有以下例子:
如上所示的例子,对于一个音频识别来说,就是一个函数,当我们将音频输入这个 f f f 来说,他的功能就是将音频的内容映射为对应的句子;对于图像识别来说说,当输入一张猫的图片,函数应该将其映射为"Cat",所以不难看出,其实所谓的机器学习,人工智能都是在干一件事情——** Looking a function
**找一个函数,这函数可以将输入的转化为一个输出结果。对于函数来说,我们想要实现的任务不同,函数要实现的功能就不同;例如我想一个函数可以将接受到的邮寄分为垃圾邮件和不是垃圾邮件,显然我们是想让函数给我们完成一个分类任务;若我们想让函数给我们预测一下什么是股票会涨/跌到哪个百分点,显然函数会给我们一个具体的数值即是一个回归任务;若我们只是想让函数给我们唱首歌绘制一幅画,即就是想让机器给我们一个创造一些有结构的something,即结构化学习。所以根据函数的不同,我们可以将这些函数分为具体的三大类
- Regression (回归)
- Classification (分类)
- Structed Learning (结构化学习)
2)如何寻找到一个函数以实现具体的功能呢?
以下是一个 youtube博主每日视频的观看人数,我们现在想要去找到一个函数能够预测出下一天的观看人数;显然这是一个回归问题,那我们该如何去找到这样一个函数呢?
其实最开始我们不需要想的那么负责,也许我们就可以先使用一个最简单的函数来作为我们要找的这个函数 y = b + w x 1 y=b+wx_1 y=b+wx1 其中 x 1 x_1 x1 被称为特征(features),也就是什么是最影响后一天播放量的特征,这里话我们可以认为前一天的播放量与后一天的播放量存在直接的关系,所以这里的 x 1 x_1 x1可以被认为是前一天的播放量,而函数中 b b b和 w w w被称之为未知参数(unkown parameters),而其中的 w w w又被叫做权重参数。
到这一步,其实我们的对于函数的选择已经完成了,可是函数中还存在未知参数,所以我们需要进一步通过2017年到2020年的已知数据去计算得到未知参数,以下我们接着去求解未知参数。
3)定义损失函数 L ( b , w ) L(b,w) L(b,w)
首先我们需要先知道什么是损失函数,假设我们现在已知了函数中的未知参数