数据分析方法：非正态数据转化成正态数据

转载

于 2017-04-11 14:00:00 发布 · 2.5k 阅读

·

0

·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/amengduo/p/9587122.html

文章标签：

#python #r语言

本文介绍了非正态分布数据转化为正态分布的思路和步骤，包括计算偏度和峰度、根据分布形状选择转换方法，如取根号、对数等，并强调了转化后需再次检验，以及数据正态化的注意事项。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

数据分析方法：非正态数据转化成正态数据

大部分的数据分析都希望原始数据是满足正态分布的定距变量。然而，显示是残酷的，在各种研究中，常常需要面对非正态分布的定距数据。为了解决数据的正态性问题，数学家们总结了很多转化方法，但是没有万能神药，都需要对症下药（根据数据的实际分布情况，选择合适的转化方法）。

下面不会介绍具体的转化方法，只是帮助大家理顺正态转化的思路，明白正态转化的逻辑，不至于将正态转化看做神秘领域，高不可攀。

正态转化四步骤

第一步：计算数据的分布状况及两个参数：偏度（Skewness）和峰度（Kurtosis）。

第二步：根据变量的分布形状和参数，决定是否做转换。

1、对称判断

看Skewness（偏差度）的取值。如果偏度为0，则是完全对称（但罕见）；如果偏度为正值，则说明该变量的分布为正偏态；如果偏度为负值，则说明该变量的分布为负偏态。然而，偏度值还不能完全判断偏态的分布是否与正态分布有显著差别，所以还需要做显著性检验。如果检验结果显著，我们可能（注意是“可能”）可以通过转换来达到或接近对称。

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。