8、数据探索与概率分布知识解析

数据探索与概率分布知识解析

1. 探索性数据分析

1.1 X26的密度直方图

X26的密度直方图展示了不同离散化方式下的分布情况,具体如下:
- 等宽离散化
- 当k = 10时,对X26进行等宽离散化得到一种密度直方图。
- 当k = 5时,对X26进行等宽离散化得到另一种密度直方图。
- 等频离散化 :k = 5时,对X26进行等频离散化得到相应的密度直方图。
- 其他离散化方式 :还包括比例k区间离散化、CAIM和MDLP等方式得到的密度直方图。

1.2 相关技术发展

  • 探索性数据分析 :由Tukey在1977年推广。
  • 玫瑰图 :1858年,护士兼统计学家Florence Nightingale首次使用玫瑰图展示了克里米亚战争(1853 - 1856)期间英国军队所面临的医院卫生条件差的情况。
  • 主成分分析(PCA) :是最古老的多元技术之一,最初由Pearson在1901年从平均投影成本最小化的角度引入,后来Hotelling在1933年从投影数据方差最大化的角度独立开发并命名。它仍然是多元分析中最广泛使用的方法之一,用于在低维空间中展示数据,并可能简化其他数据分析。此外,还有概率PCA、贝叶斯PCA、核PCA和非线性PCA等变体。
    • 概率PCA
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值