利用自编码器去除图像噪声及LSTM进行影评情感分析
1. 自编码器去除图像噪声
自编码器是一类能够学习输入图像潜在表示的神经网络,所有自编码器都包含编码器和解码器组件。编码器的作用是将输入编码为学习到的压缩表示,解码器则使用该压缩表示重构原始输入。
1.1 数据集介绍
之前在MNIST数据集上应用了去噪自编码器,现在来看一个更复杂的数据集,它能更好地代表现实生活中文档去噪的挑战。该数据集由加州大学欧文分校(UCI)免费提供,也可在相关GitHub仓库中找到。数据集包含216张不同的有噪图像,这些图像是扫描的办公文档,存在咖啡渍、褶皱痕迹等常见缺陷,并且每张有噪图像都对应一张无噪的参考清洁图像。
数据集路径如下:
noisy_imgs_path = 'Noisy_Documents/noisy/'
clean_imgs_path = 'Noisy_Documents/clean/'
1.2 数据加载
使用Keras的 load_img 函数将 .png 图像加载到Python中,再用 img_to_array 函数将加载的图像转换为numpy数组。
加载有噪图像的代码如下:
import os
import numpy as np
from keras.preprocessing.image import load_img, i
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



