【ML】自动编码器结合逻辑回归用于分类预测(数据+代码详细教程)

本文介绍了如何利用自动编码器进行特征提取,特别是用于分类预测任务。首先,解释了自动编码器的原理和其在无监督学习中的作用。接着,通过训练多层感知机自动编码器并保存编码器部分,展示了如何将编码器用作数据预处理步骤。最后,通过对比未使用编码器的逻辑回归模型和使用编码器后的模型性能,证明了编码器能提升分类预测的准确性。

自动编码器(aotoencoder)是一种神经网络,可用于学习原始数据的压缩表征。一种自动编码器由编码器(encoder)和解码器(decoder)两个子模型组成。编码器压缩输入,解码器尝试从编码器提供的压缩数据重新创建输入。训练后,保存编码器模型,丢弃解码器。
编码器可以用作数据准备技术,对原始数据进行特征提取,用于训练不同的机器学习模型。在本文中,我们将介绍如何开发和评估用于分类预测建模的多层感知机自动编码器。
阅读完本文后,你将知道:

1.自动编码器是一种神经网络模型,可用于学习原始数据的压缩表征;

2.如何在训练集上训练自动编码器,并只保存模型的编码器部分;

3.如何使用编码器作为训练机器学习模型时的数据准备步骤;

一、用于特征提取的自动编码器

自动编码器是一种神经网络模型,它试图学习输入的压缩表征。尽管在技术上,它们是使用监督学习方法(称为自监督学习方法)进行训练的,但是它们是一种无监督学习方法。自动编码器通常作为一个更广泛的模型的一部分进行训练,该模型试图重新创建输入。
例如:


X = model.predict(X)

自动编码器模型的设计通过将体系结构限制在模型中点的瓶颈处,来故意使问题变得具有挑战性,从该瓶颈处执行输入数据的重构。自动编码器的类型有很多,它们的用途各不相同,但可能更常见的用途是作为一种学习或自动特征提取模型。在这种情况下,一旦模型被拟合,就可以放弃模型的重构方面,并使用到瓶颈点的模型。瓶颈处模型的输出是一个固定长度的向量,它提供了输入数据的压缩表征。然后,可以将来自域的输入数据提供给模型,在瓶颈处的模型输出可以用作监督学习模型中的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

机器不学习我学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值