卷积网络与自编码器:实践与原理剖析
1. 卷积网络的实践与挑战
卷积网络在图像分类等任务中表现出色,但也存在一些问题。为了找到最小的扰动,通常可以尝试不同的方法,这些方法也被称为攻击。通过计算对抗样本可以实现不同的目标,例如让输入被错误分类,或者让输入被分类为特定的期望类别。
在构建对抗性扰动时需要谨慎,这表明卷积网络可能在利用一些微妙的特征。虽然可能找到抵抗这些攻击的方法,但卷积网络可能本质上就容易受到这些微妙图像操作的影响。这说明卷积网络仍有许多未知之处,不能被认为是万无一失的。
在实践中,我们研究了两个实际的卷积网络:一个用于对手写MNIST数字进行分类的小型网络,以及用于对照片进行分类的较大的VGG16网络。小型的MNIST网络虽然规模小,但能够以约99%的准确率对数字进行分类。VGG16网络的滤波器从寻找简单的结构(如边缘)开始,逐渐构建出复杂而美丽的有机模式。
然而,作为图像分类器的卷积网络容易被微小的像素值调整所欺骗,这些调整对人类观察者来说是难以察觉的。
2. 自编码器简介
自编码器是一种用于压缩输入的机制,类似于MP3编码器压缩音乐或JPG编码器压缩图像。自编码器通过训练自动学习如何最好地编码或表示输入数据。在实践中,自编码器通常用于两种任务:去除数据集中的噪声和降低数据集的维度。
3. 编码基础
文件压缩在计算机领域非常有用。MP3格式可以大幅压缩音频文件,同时保持可接受的音质;JPG格式可以将图像文件压缩至原来的二十分之一,同时保持图像的可接受质量。这两种压缩方式都属于有损编码,即压缩后的文件只是原始文件的近似,压缩程度越高,与原始文件的差异越容易被察
卷积网络与自编码器的深度解析
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



