Python利用随便一组数据绘制直方图

本文介绍了如何使用Python的matplotlib、pandas和numpy库高效地绘制大数据样本的直方图。通过pandas统计数据的唯一值及其频率,然后展示绘制直方图的步骤,包括添加标注和初始化图表格式,特别适合处理大规模数据集的情况。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

文章目录

0 环境

  • python: ×64位的3.6.4
  • 包: matplotlib、pandas、numpy

1 实操

 如果是一组数据,要绘制它的直方图,这个时候,我们既没有这组数据的唯一值,又没有唯一值出现过的次数。那我们首先就需要得到这些唯一值,以及他们出现的次数。
 如果是小数据样本(w级以下),那么不用担心,你完全可以利用for循环进行统计。但是,当数据样本量过大,for循环的统计效率就没有那么高了。此时,我们可以利用pandas中的某些函数,来达到一个高效统计的效果,方便绘制直方图。具体操作如下:

  • 1 统计唯一值及出现次数
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# 模拟100个[1, 10]之间的整数,用来绘制直方图
data = [np.random.randint(1, 10) for a in range(1, 101)]
# 将列表转换成pandas的Series格式(因为里边有自带的函数可以统计元素出现的个数, for统计列表中元素出现的次数,效率过慢,不适用于大数据量)
data_pd = pd.Series(data)
l_unique_data = list(data_pd.value_counts().index)  # 该数据中的唯一值
l_num = list(data_pd.value_counts())  # 唯一值出现的次数
  • 2 绘制直方图
plt.bar(l_unique_dat
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值