深度学习（一）

yeyustudy

于 2018-07-25 16:19:14 发布

阅读量243

点赞数

分类专栏：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/yeyustudy/article/details/81205092

版权

人工智能专栏收录该内容

34 篇文章

订阅专栏

算法的优化

任何网络要想达到极好的效果都不是一簇而就的，需要一个迭代的过程，不断的调整参数，如果初始参数能够设置的很好，无疑能够极大的缩短这个过程。

数据集

对于数据集，大体可分为三类：训练集，交叉验证集，测试集
1、在机器学习时代，三者的比例为6：2：2，但随着数据的爆炸式的增长，训练集的比例占的越来越大，而其余两者只需要很少的数据进行验证即可。
2、当测试集跟训练集不匹配时，一个原则是验证集与测试集服从相同的分布，这样算法达到最优的速度最快

误差

高偏差：对训练集拟合较差
高方差：对训练集拟合较好，但对测试集拟合较差
1、如果偏差较高，我们要么采用规模更大的网络，要么延长训练时间，或者选择其他的网络结构，如果偏差降下来了，方差过高，此时可以尝试更多的数据，或者进行正则化，或者找到更合适的网络结构
2、以逻辑回归为例，通常正则化使用L2范数，即 $\frac{\lambda }{{2m}}||w|{|^2}$ ，使用L1范数可以增加参数的稀疏程度
3、dropout：遍历结点，随机删除一些结点，之后训练网络，这样网络变得精简，训练也会消除过拟合，目前最有效的dropout算法是反向dropout算法，在去除一些结点后，激活值再除以这个保留概率。
4、另外几种正则化的方法：数据集扩增（通过翻转，变形等）、early stop（实质是过早的停止优化代价函数，这样就不会出现过拟合）

加速训练

1、归一化输入： $\frac{{x - \mu }}{{{\sigma ^2}}}$

梯度消失与梯度爆炸

梯度的计算遵循链式法则，如果前一层梯度变化过小，神经网络的深度如果过深，就会出现梯度消失，如果前一层梯度变化过大，就会出现指数级的增长，即梯度爆炸
解决的办法是对初始权证的调整：将每个神经元的权重向量按下面的方法进行初始化:w=np.random.randn(shape)/sqrt(1/n)

利用梯度检验来检验反向传播

这里写图片描述

博客等级

码龄8年

77
原创

16
点赞

89
收藏

28
粉丝

关注

私信

热门文章

分类专栏

最新评论

deeplab v3+训练自己的数据集
Hey^O^: 你好，改了后miou很低才0.1几，请问如何解决
deeplab v3+训练自己的数据集
舟阿白: 博主，请问文末最后的错误2，提到在eval.py中修改代码。但是我没有在我的deeplabv3+ eval.py代码里找到metric_map[predictions_tag] = tf.metrics.mean_iou这一句呢？请问您的是在哪里找到的呢？
deeplab v3+训练自己的数据集
yeyustudy 回复刘子晞的博客: 是转换成灰度图，因为标签在训练的时候就是通过灰度值代表类别，不过我建议还是通过labelme进行标注，这样比较标准
deeplab v3+训练自己的数据集
刘子晞的博客: 请问博主大大，用ps标注后，怎样转换数据格式？转成的还是RGB三通道的是么？
deeplab v3+训练自己的数据集
高尔琪: 博主，有联系方式吗？希望能交流交流

大家在看

阿里语音处理工具ClearerVoice-Studio项目上手指南 251

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。