12、使用自动编码器去除图像噪声

最新推荐文章于 2025-12-26 13:37:44 发布

原创最新推荐文章于 2025-12-26 13:37:44 发布 · 21 阅读

CC 4.0 BY-SA版权

文章标签：

20 篇文章 ¥499.90

订阅专栏¥69.90

在之前的示例中，我们用耳朵形状和口鼻大小等描述潜在表示。但实际上，潜在表示只是一个数字矩阵，很难为其赋予有意义的标签，也没必要这么做，这些描述只是为了直观解释潜在表示。

自动编码器能学习输入数据的降维表示，有人会认为它能很好地进行通用数据压缩，然而并非如此。自动编码器在通用数据压缩方面表现不佳，如JPEG图像压缩和MP3音频压缩，因为它学习到的潜在表示仅代表训练数据，也就是说，它只对与训练数据相似的图像效果较好。

此外，自动编码器是一种“有损”的数据压缩方式，其输出信息比原始输入少。这些特性表明，自动编码器不适合作为通用数据压缩技术，像JPEG和MP3等其他数据压缩形式比它更优越。

我们使用MNIST手写数字数据集进行实验。该数据集包含70,000个手写数字样本，每个样本是28 x 28像素的图像，且每个图像只包含一个数字，所有样本都有标签。

在Keras中可以直接导入该数据集，代码如下：

from keras.datasets import mnist
training_set, testing_set = mnist.load_data()
X_train, y_train = training_set
X_test, y_test = testing_set

为了更好地可视化数据，我们使用matplotlib绘制数据，代码如下：