人工神经网络与生物神经网络?
生物神经网络就是将数以万计的细胞联结, 将感官和反射器联系在一起的系统。而人工神经网络是对生物神经元结构和功能的模拟。人工神经网络靠的是正向和反向传播来更新神经元, 从而形成一个好的神经系统, 本质上, 这是一个能让计算机处理和优化的数学模型. 而生物神经网络是通过刺激, 产生新的联结, 让信号能够通过新的联结传递而形成反馈。
什么是神经网络?
一种数学模型,一种建模工具,常用输入和输出间的复杂关系进行建模或用来探索数据的模式。
输入层:直接接受信息的神经层,负责传递接收到的信息,比如输入一只猫的图片。
输出层:信息在神经元链接中传递,中转,分析,权衡,形成输出结果,通过对这一层的输出结果可以看出计算机对事物的认知。
隐藏层:在输入层和输出层之间众多神经元和链接组成的各层
神经网络的梯度下降
找出梯度线躺平的地方,就是最优解,一般是局部最优解。
什么是卷积神经网络CNN
卷积神经网络在图像处理方面有着广泛的应用。何为卷积?顾名思义,就是对图像中每一小块像素进行处理。这样做加强了图像的连续性,而不是看到图像上一个像素点。简单来说,卷积神经网络有一个图像过滤器,不断从图片上滚动收集图像的信息,每次收集的信息只是收集的一小块像素区域,然后将收集来的信息进行整理,然后对这些信息进行实际上的呈现。然后再用边缘过滤器,总结出更高级的信息,如总结的信息可以画出眼镜和鼻子等,在经过一次过滤,脸部的信息也被这些眼睛、鼻子的信息总结出来,最后,我们再将这些信息套入普通的卷积神经网络,就能得到输入的图片能分成哪一类的结果了。
什么是循环神经网络RNN
循环神经网络是用来处理序列数据的神经网络。eg你预测下一个单词是什么?你需要用到前面的单词,因为句子中前后单词并不是独立的。而传统的神经网络从输入层到隐藏层再到输出层,层与层之间是连接的,而每层之间的节点是无连接的。
什么是LSTM RNN?
LSTM(Long Short-term Memory 长短期记忆)RNN是为了解决传统RNN的问题。
当W是一个小于1的数,就能得到一个较小误差的数。当W是一个大于1的数,则这样累乘后误差就会扩大。为了解决这种情况,解决无法决久远记忆,多出了三个控制器。
此处,粗线代表控制全局的记忆,如果此时的分线剧情按重要程度进行分析,如果此时的分线剧情改变了我们之前剧情的想法,那么忘记控制就会将之前的主线剧情忘记,换成现在的分剧情。所以,剧情更新就取决于分线的输入和忘记控制。
什么是自编码(Autoencoder)
接受一张图片,然后给他打码,接着在还原。
什么是GAN(生成对抗网络)
例如戴眼镜的男人-没戴眼镜的男人+没带眼镜的女人=戴眼镜的女人
迁移学习(站在巨人的肩膀上)
比如学习了粤菜,通过迁移模型,可以训练出川菜,北京菜等
神经网络进化
①遗传算法
②进化策略
怎么检验神经网络
机器学习如此精准,为什么我们要去检验这个神经网络呢?其实在神经网络的训练中,神经网络可能会和我们一样会出现各种各样的问题,出现学习的效率不高,或者是学习的干扰太多,学到最好并没有很好地学到这些数据所得到的规律,但是这其中的原因可能是多方面的,可能是数据问题,也可能是数据网络参数的问题,因此,为了检验评价神经网络,为了改善或者规避这些问题。我们通常会把收集到的数据分为训练数据和测试数据。一般用于训练的数据可以是所有数据的7成,剩下的3成可以作为测试数据用来检验训练结果。
为什么要特征标准化
将小的数据放大,将大的数据压缩。如下图所示,有两种方法,其中一种是将数据缩放到0到1间。加快机器学习的进度,避免数据过于扭曲。
怎么区分好用的特征?
假设用毛色的方法来区分金毛和吉娃娃,那么,很遗憾,金毛和吉娃娃中偏白和偏黄的数据占了一半,没办法区分,但是可以根据身高来判断。
为什么用激励函数?
数据本来是线性的,通过激励函数AF()后,把原有的数据掰弯了。如下面那几个函数都可以看作是激励函数。
什么是过拟合?
自负=过拟合。不能表现除训练数据的其他数据。
加速神经网络训练(SGD)
所以, 最基础的方法就是 SGD 啦, 想像红色方块是我们要训练的 data, 如果用普通的训练方法, 就需要重复不断的把整套数据放入神经网络 NN训练,
处理不均衡数据
①想办法获取更多的数据。
②换个评判方式。
③重组数据(复制或重新合成少部分的样本)
什么是批标准化
Batch Normalization, 批标准化, 和普通的数据标准化类似, 是将分散的数据统一的一种做法,