今天开始看陆老师的视频课,主要是针对数学部分的做介绍,我自己做笔记整理自己的理解(纯新手,后悔没认真学大学的线性代数)。
机器学习涉及到的数学知识主要包括矩阵运算&&概率,刚刚开始接触的时候怎么说也得把常见的知识点理解清楚。
学习之后,我觉得可以用下面的例子来介绍我的理解,假如我们要识别0-9数字的图片(例如像素为36*36),那么应该先将该图片转换为一个36阶的方阵,写相应算法,找例如1W个正确的图片给计算机处理,我们也要告诉计算机相对应的图片为多少,这个阶段成为机器训练。
训练完之后,输入一张图片,计算机处理图片会得到一个0-9相应数字的概率,最高的数字的概率就是计算机训练之后给出的答案。
一、下面记录了视频里面了解到的常见矩阵知识点,
- 同型矩阵,行列数相等的矩阵
- 矩阵的加减法,前提是要做运算的矩阵是同型矩阵,加减的办法就是,同样的位置做加减法,得到的也是一个同型矩阵
- 矩阵的乘法,矩阵的乘法必须满足第一个矩阵的列数等于第二个矩阵的行数,可以表示为(K,M)*(M,N), 这样就得到了一个(K,N)的矩阵
- 矩阵的运算法则
A) 针对加法,可以交换顺序
B) 针对乘法,满足结合律>> ABC=A(BC),分配律>> A(B+C)=AB+AC - 特殊的矩阵有如下
A) 方阵,就是正方形矩阵,行与列相等的矩阵,很多下面要介绍的矩阵都是基于方阵的基础上
B) 对角矩阵,前提是方阵,对角线外的点都是0,对角线不关注是否为0, 要是对角线上数据一样,那么可以称之为数量矩阵
C) 单位矩阵,主对角线上的数都为1,其他的是0,其实也可以说单位矩阵也是对角矩阵吧,
D) 对称矩阵,以主对角线为对称中心线对称的矩阵 - 矩阵的转置,用T表示,可以理解为讲矩阵顺时针旋转90对,再翻转一次之后我们看到的矩阵
- 正交矩阵,A*A‘=E,任何矩阵乘以该矩阵的转置得到一个的单位矩阵。
- 向量,有序排列的一组数
- 矩阵可以被分解为一组特征向量和特征值的乘法,数学公式可以表示为Ax=b, 这一节需要重点关注,因为该节内容很多原理应用于机器学习中,这里的特征向量可以理解为入参的特征,特征值则可以理解为该特征的权重,整个机器训练的过程,按照我现在学习的,就是一个找到一组权重,可以令后面的让机器判断的时候,将特征与权重组合,得到我们想要的结果的。
10.奇异值分解,这一概念也是重点,暂时先了解下概念。一个矩阵可以分解为A=UDV’,UV都是正交矩阵,我们称D为奇异值,U为左奇异向量,V为右奇异向量(right singular vector)
二、概率
- 概率其实还是比较容易理解的,主要有三个类型的概率需要掌握
A) 条件概率
B) 全概率
C) 贝叶斯概率(在尚未应用到代码之前,还没领会其用处,就是方便计算而已,换个办法)