26、工程师统计学习入门介绍

day7

于 2025-09-05 09:05:32 发布

阅读量13

点赞数

CC 4.0 BY-SA版权

分类专栏：工程中的统计学习文章标签：特征转换自动编码器实验设计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/day7/article/details/152405577

工程中的统计学习专栏收录该内容

53 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

工程师统计学习入门介绍

在数据处理和机器学习领域，有许多关键的概念和方法对于分析和利用数据至关重要。本文将介绍特征转换、自动编码器、实验设计等方面的内容，帮助大家更好地理解和应用统计学习方法。

1. 特征转换与降维

特征转换是数据处理中的重要步骤，通过将原始特征转换为新特征，可以在减少信息损失的同时降低特征向量的维度。观察新特征 $Z_{j\mathcal{l}}$ 作为原始特征 $X_{jk}$ 的线性组合的权重，可以尝试解释新特征。例如，$Z_{j1}$ 本质上是前六个旧特征的加权平均值，其中 $X_{j1}$ 和 $X_{j2}$ 的权重稍大，后者描述了坑柱的整体尺寸；$Z_{j2}$ 主要是 $X_{j3}$、$X_{j4}$、$X_{j8}$ 的平均值，并且与 $X_{j6}$ 符号相反，其解释并不直接；$Z_{j3}$、$Z_{j4}$、$Z_{j5}$ 主要由一个原始特征决定，分别是 $X_{j7}$、$X_{j8}$ 和 $X_{j5}$。使用这五个新特征，特征向量的维度显著降低，而前五个主成分仍能解释原始八个输入变量约 95% 的变异性。

2. 自动编码器

自动编码器是一种机器学习算法，旨在通过将特征向量作为学习系统的输入和输出，有效地对其进行编码。它首先将通常高维的输入向量降维为低维表示，然后尝试尽可能恢复原始特征。早期的一些应用侧重于信息的稀疏编码，即找到一种信号表示，其存储或传输所需的容量较小，但允许在小偏差范围内重建完整的原始信号。

如今，自动编码器常用于处理由专家提出的包含许多可能与数据分析任务相关特征的输入向量。通常，几个特征描述了关于分类或预测系统输出的相似信息，但这通常并不明显。真正的信息是低维结构的一

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。