20.Unsupervised Learning-Auto-encoder

最新推荐文章于 2021-08-14 23:09:20 发布

Aamax

最新推荐文章于 2021-08-14 23:09:20 发布

阅读量279

点赞数 1

CC 4.0 BY-SA版权

分类专栏：深度学习_李宏毅课程

本文链接：https://blog.youkuaiyun.com/xjtuse123/article/details/90376446

深度学习_李宏毅课程专栏收录该内容

30 篇文章

订阅专栏

自编码器是一种无监督学习方法，用于数据降维和特征抽取。它由编码器和解码器组成，通过学习输入数据的压缩表示和重构。自编码器广泛应用于文本检索、相似图像搜索、深度神经网络预训练、去噪自编码器和卷积神经网络。通过编码器和解码器的联合训练，即使在非监督环境下也能学习到有效表示。

Auto-encoder

自编码器是一种无监督学习方法，可用于数据降维及特征抽取。自编码器由编码器（Encoder）和解码器（Decoder）两部分组成。编码器通常对输入对象进行压缩表示，解码器对经压缩表示后的code进行解码重构。

它的思想是，找一个encoder，比如input一张image，经过encoder，output一个code，它的维度要远比input小，那这个code就代表了这个input某种精简的有效的representation。

但是现在问题是非监督的，我们可以找到一堆input但是不知道output是什么，那我们可以先learn一个decoder，它可以input一个vector然后output一个image。你也没办法train decoder，因为你也只有output。

二者单独都不能train，但是可以把二者联系起来一起train。

从PCA中，input一个image x，乘上weight得到component，component再乘以weight的transports，得到x^,minimize x和x^

这里面只有一层的hidden layer，hidden layer的output就是code

我们可以用gradient decent来解PCA，但是它只有一个hidden layer，也可以将它改成很多的hidden layer。

中间会有一个特别窄的layer，它有特别少的neuron，这个layer的output就代表了一组code。input到bottle是encode，bottle到output是decode。左右两边的weight没必要互为transport(互为transport可以减少参数数目，防止overfitting)，但是并不必要，直接用BP训练即可。

结果图如下:

下图是Hinton原始论文中的结果：PCA把784维降到30维再恢复到784维，deep auto-encoder结构见下。如果用PCA降到2维，则digits都混在一起，而deep auto-encoder降到2维可以把digits分开。

应用一 Auto-encoder ——Text Retrieval

假设我们想做文字搜寻，可以将一篇文章压成一个code，得到vector space model，把查询词汇也变成一个vector，从而进行查询。查询词汇与文章的点坐cos similarity，距离最近的话就会检索这个document。那现在的问题就是这个文章的vector你表示的好不好。

一般的文本检索方法有向量空间模型（Vector Space Model），上图中蓝色的点代表的是文档（经过降维后），接着计算要查询的文档与其他的距离，选择较为接近，相似程度高的，但这个模型的好坏关键取决于向量化的好坏；单词包（Bag-of-word），通过建立一个词向量，若文档中存在某些词记1否则记0，然后再计算相似性，但此模型不能很好的表达语义层面。

可以用auto-encoder：将一篇文章经过encoder把它压成二维的，每个document会被标成某一类，结果图如下，同一类document在一起。