numpy统计分布显示

本文通过使用numpy和sklearn库,对鸢尾花数据集进行深度分析,包括计算花瓣长度的统计特征,如最大值、平均值、中值和均方差。同时,运用matplotlib库绘制了花瓣长度的正态分布图、曲线图和散点图,直观展示数据分布特性。
#加载numpy包
import numpy
#加载sklearn包
from sklearn.datasets import load_iris 
#读出鸢尾花数据集data
data=load_iris()
#鸢尾花花瓣长度的数据
petal_length=numpy.array(list(len[2] for len in data['data'])) 
print(petal_length)

#计算鸢尾花花瓣长度的最大值,平均值,中值,均方差
print(numpy.max(petal_length))
print(numpy.mean(petal_length))
print(numpy.median(petal_length))
print(numpy.std(petal_length))

#用np.random.normal()产生一个正态分布的随机数组,并显示出来
import numpy as np
import matplotlib.pyplot as plt
mu = 5  #期望为5
sigma = 3  #标准差为3
num = 1000  #个数为1000
normal_data = np.random.normal(mu, sigma, num)
print(normal_data)

#用np.random.randn()产生一个正态分布的随机数组,并显示出来
a=np.random.random(25)
print(a)

#显示鸢尾花花瓣长度的正态分布图,曲线图,散点图
import numpy as np
import matplotlib.pyplot as plt

mu=np.mean(petal_length)   
sigma =np.std(petal_length)  
num=1000

normal_data = np.random.normal(mu, sigma, num)
count, bins, ignored = plt.hist(normal_data, 30, normed=True)
plt.plot(bins, 1/(sigma * np.sqrt(2 * np.pi)) *np.exp( - (bins - mu)**2 / (2 * sigma**2)), linewidth=2, color='orange')
plt.show()

plt.plot(numpy.linspace(0,150,num=150),petal_length,color='orange')
plt.show()

plt.scatter(numpy.linspace(0,150,num=150),petal_length,color='orange')
plt.show()

 

转载于:https://www.cnblogs.com/nuan-z/p/9831969.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值