深度学习中的特征表示与学习方法
在深度学习领域,特征表示与学习是至关重要的环节,它能帮助我们从数据中提取有价值的信息,以更好地完成各种任务。下面将详细介绍几种常用的特征表示与学习方法。
1. 去噪自编码器(Denoising Autoencoder)
人类的感知能力对噪声具有惊人的抗性。例如,在MNIST数据集中,即使图像中一半的像素被损坏,我们仍然能够识别出数字,甚至容易混淆的数字(如2和7)也能区分开来。从概率的角度来看,即使我们只看到图像像素的随机样本,只要有足够的信息,大脑就能以最大概率推断出像素所代表的真实内容。
去噪自编码器的基本原理很简单。我们将输入图像中固定比例的像素置为零,得到损坏后的版本$C_X$。去噪自编码器与普通自编码器的唯一区别在于,编码器网络的输入是损坏后的$C_X$,而不是原始输入$X$。这迫使自编码器学习一种对损坏机制具有抗性的编码,能够通过缺失信息进行插值,以重建原始的未损坏图像。
从几何角度来看,对于具有各种标签的二维数据集,特定类别的数据点子集$S$可能存在一种潜在的统一几何结构,称为流形(manifold)。自编码器在学习通过瓶颈层(代码层)重建数据时,会隐式地学习这个流形。
以下是构建去噪自编码器的代码示例:
import tensorflow as tf
def corrupt_input(x):
corrupting_matrix = tf.random_uniform(shape=tf.shape(x),
minval=0,maxval=2,dtype=
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



