【ML】自动编码器结合逻辑回归用于分类预测(数据+代码详细教程)

原创已于 2022-10-26 17:07:46 修改 · 1.4k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#分类 #机器学习 #深度学习

于 2022-10-25 16:44:30 首次发布

机器学习实战蓝皮书专栏收录该内容

37 篇文章 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了如何利用自动编码器进行特征提取，特别是用于分类预测任务。首先，解释了自动编码器的原理和其在无监督学习中的作用。接着，通过训练多层感知机自动编码器并保存编码器部分，展示了如何将编码器用作数据预处理步骤。最后，通过对比未使用编码器的逻辑回归模型和使用编码器后的模型性能，证明了编码器能提升分类预测的准确性。

自动编码器（aotoencoder）是一种神经网络，可用于学习原始数据的压缩表征。一种自动编码器由编码器（encoder）和解码器（decoder）两个子模型组成。编码器压缩输入，解码器尝试从编码器提供的压缩数据重新创建输入。训练后，保存编码器模型，丢弃解码器。
编码器可以用作数据准备技术，对原始数据进行特征提取，用于训练不同的机器学习模型。在本文中，我们将介绍如何开发和评估用于分类预测建模的多层感知机自动编码器。
阅读完本文后，你将知道：

1.自动编码器是一种神经网络模型，可用于学习原始数据的压缩表征；

2.如何在训练集上训练自动编码器，并只保存模型的编码器部分；

3.如何使用编码器作为训练机器学习模型时的数据准备步骤；

一、用于特征提取的自动编码器

自动编码器是一种神经网络模型，它试图学习输入的压缩表征。尽管在技术上，它们是使用监督学习方法（称为自监督学习方法）进行训练的，但是它们是一种无监督学习方法。自动编码器通常作为一个更广泛的模型的一部分进行训练，该模型试图重新创建输入。
例如：


X = model.predict(X)

自动编码器模型的设计通过将体系结构限制在模型中点的瓶颈处，来故意使问题变得具有挑战性，从该瓶颈处执行输入数据的重构。自动编码器的类型有很多，它们的用途各不相同，但可能更常见的用途是作为一种学习或自动特征提取模型。在这种情况下，一旦模型被拟合，就可以放弃模型的重构方面，并使用到瓶颈点的模型。瓶颈处模型的输出是一个固定长度的向量，它提供了输入数据的压缩表征。然后，可以将来自域的输入数据提供给模型，在瓶颈处的模型输出可以用作监督学习模型中的