关于“调包”，职业调包侠在此【update ++】！

最新推荐文章于 2024-07-11 17:52:23 发布

原创最新推荐文章于 2024-07-11 17:52:23 发布 · 500 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#SimCSE #自编码器 #机器学习

机器学习专栏收录该内容

11 篇文章

订阅专栏

本文探讨了自编码器在特征压缩中的应用，以及PCA和SVD在降维中的角色。介绍了BERT-whitening通过PCA/SVD进行句子向量的白化处理，并讨论了为何SVD在实践中更常用。同时，文章介绍了SimCSE利用Dropout作为无监督的数据扩增手段，改进了BERT模型，提升了文本embedding的效果。实验表明，降维和正负样本策略能有效提高模型性能。

部署运行你感兴趣的模型镜像

1.“铲子”的经验、学习记录，不定期update【接上】

7）自编码器

结论：用来压缩特征，得到这个encoder，生成 $y$
在这里插入图片描述
自编码器模型主要由编码器（Encoder）和解码器（Decoder）组成，其主要目的是将输入 $x$ 转换成中间变量 $y$ ，然后再将 $y$ 转换成 $x~\tilde{x}$ ，然后对比输入 $x$ 和输出 $x~\tilde{x}$ 使得他们两个无限接近。比如建立一个MSE的loss，然后优化这个loss。

其实就是无监督的一个embedding

另外，和PCA这种思想也是，有损压缩，尽量信息损失少

8）无监督文本embedding（学习了下新东西）

BERT-whitening：

思路很简单，就是在得到每个句子的句向量 ${x_i}$ 后，对这些向量进行一个白化（也就是PCA/SVD），使每个维度的均值为0、协方差矩阵为单位阵，然后保留k个主成分。
在这里插入图片描述
为啥多用SVD：https://zhuanlan.zhihu.com/p/58064462
SVD与PCA等价，所以PCA问题可以转化为SVD问题求解，那转化为SVD问题有什么好处？
方阵的特征值分解计算效率不高，SVD除了特征值分解这种求解方式外，还有更高效且更准确的迭代求解法。