作者:18届 cyl
日期: 2021-08-08
论文:《Understanding Neural Networks Through Deep Visualization》
一、简单介绍
提供两个可以直观理解DNN内部工作过程的工具。
第一种工具是在处理图像或视频时,将经过每个层上产生的激活值进行可视化。
第二种工具通过对激活最大化加一些正则化项,改进优化图像的显示结果。
二、问题陈述
1.大型深度神经网络模型的训练方面取得了巨大的进步(AlexNet)。
2.人们无法准确理解神经网络到底学习到了什么(它有大量的相互作用且非线性的的神经元所以比较难理解)
3.观察模型已经学习到的特征对于理解当前的DNN如何工作以及如何改进它们很重要。【工具一】
4.有人提出梯度上升的方法来求使某个单元的激活最大时候的图像,作为该单元正在寻找的答案。
从初始输入开始,计算在某个单元处由该输入引起的激活。然后沿着梯度的方向在输入空间中迭代,使得单元产生的激活值越来越高,最终的被认为是该单元正在寻找的答案(最希望看到的特征)。
5.这种基于梯度gradient-based的方法以简单著称,也衍生了很多类似的方法。但这类方法的一个问题就是优化过程中产生的图像往往与自然图像不太相似(比如下图)。
6.为了获得更好的优化图像,我们对这个优化过程进行加入正则化项【工具二】。

本文介绍了两种理解深度神经网络(DNN)工作原理的工具。一是通过可视化每层激活值展示DNN处理图像的过程;二是利用正则化优化的梯度上升方法生成更自然的优化图像。研究提出了四种正则化技术:L2衰减、高斯模糊、像素范数截断和贡献值截断,以改进优化图像的质量。这些方法有助于研究人员调试和改进模型,提高DNN的可解释性。
最低0.47元/天 解锁文章
1671

被折叠的 条评论
为什么被折叠?



