峰度和偏度
偏度和峰度如何影响您的分布
偏度(skewness)和峰度(kurtosis)
摘要
偏度Skewness定义中包括正态分布(偏度=0),右偏分布(也叫正偏分布,其偏度>0),左偏分布(也叫负偏分布,其偏度<0)
峰度Kurtosis包括正态分布(峰度值=3),厚尾(峰度值>3),瘦尾(峰度值<3)型
测试
我们随机模拟一组正态分布数据,然后用seaborn图像检测它和正态分布的拟合程度。可以看到峰度和偏度都是在0附近,说明dataframe的kurt函数峰度值是减3的。

附代码
import pandas as pd
import seaborn as sns
import numpy as np
from scipy.stats import norm
import warnings
warnings.filterwarnings('ignore')
%matplotlib inline
norm_array =np.random.normal(0,1,2000)
norm_dataframe =pd.DataFrame(norm_array,columns=['test'])
sns.distplot(norm_dataframe, fit=norm);
print("Skewness: %f" % norm_dataframe.skew())
print("Kurtosis: %f" % norm_dataframe.kurt())
本文深入探讨了偏度和峰度的概念,解释了它们如何影响数据分布,并通过实际代码演示了如何使用Python的seaborn库来检测一组正态分布数据的偏度和峰度。
5481

被折叠的 条评论
为什么被折叠?



