数据预处理
文章平均质量分 52
小桥流水---人工智能
一切皆有可能!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
参数 stratify=y 在训练集和测试集划分中的作用!!
是否加stratify说明❌ 不加数据随机打乱,可能某些类别偏斜甚至丢失✅ 加stratify=y保持标签分布一致,适合分类问题,强烈建议使用。原创 2025-04-15 08:56:38 · 360 阅读 · 0 评论 -
PCA(主成分分析)不是“筛掉”特征,而是“合并”、“压缩”特征。
特征选择是 “在原来的变量中挑出重要的”;PCA是 “把所有变量揉合在一起,提取出几个最能代表数据的信息方向”。原创 2025-04-14 15:05:53 · 711 阅读 · 0 评论 -
大白话解释:PCA 降维(主成分分析,Principal Component Analysis)
这些 10 个属性里,其实有几个是重复、冗余的。我们可以把它们合并成‘综合指标’,只用 2~3 个就能代表整个数据的大部分信息。就像你拍一张照片时,虽然把三维的世界压缩成二维图像,但我们依然能看清楚物体形状 —— PCA 就干了类似的事情!原创 2025-04-14 14:59:16 · 607 阅读 · 0 评论 -
通俗的理解:MIC相关系数(最大信息系数,Maximal Information Coefficient)
MIC 就像一个万能探测器,它不关心关系是不是直的,只要你俩之间有“规律”,它就能发现。原创 2025-04-14 14:11:48 · 649 阅读 · 0 评论 -
通俗易懂的方式理解:EMD(经验模态分解)与VMD(变分模态分解)的共同点和不同点
EMD 更像是“经验派、简单直接”;VMD 更像是“数学派、稳定精准”。EMD适合初步探索,VMD更适合对信号质量要求高、应用场景复杂的分析任务。原创 2025-04-14 11:21:16 · 1418 阅读 · 0 评论 -
理解:变分模态分解(VMD, Variational Mode Decomposition)
VMD 就像一个“频率过滤器”,把一个混合信号按频率拆成几部分,让我们能分别分析它们的特点。振动分析(如机械故障检测)电力系统信号处理生物信号(心电、脑电)分解风电/风速/温度信号预处理。原创 2025-04-14 11:13:01 · 684 阅读 · 0 评论 -
详细解释:k ≈ 3 对应 99.7% 置信度
出现在统计学或异常检测中,和有关。原创 2025-04-13 20:46:06 · 849 阅读 · 0 评论 -
ReliefF 的原理
如果同类越像、异类越不像,就说明这个特征越有区分能力,权重越高。原创 2025-04-13 19:55:44 · 984 阅读 · 0 评论 -
什么是“偏态”与“厚尾”?
定义:数据分布在均值的一侧拉长或压缩,呈现不对称结构。正偏(右偏):右侧尾巴较长,如收入、寿命分布;负偏(左偏):左侧尾巴较长。原创 2025-04-13 16:20:25 · 1199 阅读 · 0 评论 -
变点分组法是一种时序数据处理与分段分析的方法
变点分组法(Change Point Segmentation Method):是一种根据时间序列中统计特征(如均值、方差、分布形态等)发生显著变化的位置,将序列自动划分为若干段的方法。每一段内部的统计特征保持相对一致,段与段之间则存在显著差异。原创 2025-04-13 15:27:04 · 534 阅读 · 0 评论
分享