使用自动编码器去除图像噪声
1. 自动编码器与数据压缩
在之前的示例中,我们用耳朵形状和口鼻大小等描述潜在表示。但实际上,潜在表示只是一个数字矩阵,很难为其赋予有意义的标签,也没必要这么做,这些描述只是为了直观解释潜在表示。
自动编码器能学习输入数据的降维表示,有人会认为它能很好地进行通用数据压缩,然而并非如此。自动编码器在通用数据压缩方面表现不佳,如JPEG图像压缩和MP3音频压缩,因为它学习到的潜在表示仅代表训练数据,也就是说,它只对与训练数据相似的图像效果较好。
此外,自动编码器是一种“有损”的数据压缩方式,其输出信息比原始输入少。这些特性表明,自动编码器不适合作为通用数据压缩技术,像JPEG和MP3等其他数据压缩形式比它更优越。
2. MNIST手写数字数据集
我们使用MNIST手写数字数据集进行实验。该数据集包含70,000个手写数字样本,每个样本是28 x 28像素的图像,且每个图像只包含一个数字,所有样本都有标签。
在Keras中可以直接导入该数据集,代码如下:
from keras.datasets import mnist
training_set, testing_set = mnist.load_data()
X_train, y_train = training_set
X_test, y_test = testing_set
为了更好地可视化数据,我们使用matplotlib绘制数据,代码如下:
超级会员免费看
订阅专栏 解锁全文
70

被折叠的 条评论
为什么被折叠?



