python 画频率分布直方图_数据挖掘之频率分布直方图(Python)

本文介绍了如何使用Python绘制频率分布直方图,包括数据预处理和使用matplotlib库绘制直方图的过程。通过去除0值并调整组距,分析微博用户轨迹数据的访问频率,为数据挖掘提供可视化支持。

前言

最近接到一个任务,来绘制一组数据的频率分布直方图。直方图是高中就学习过的知识,但是在科研、数据分析中仍然占有很高的地位。一开始我认为这个只需要用Excel就可以轻松实现,但是对Excel的绘图不熟悉,折腾了半天才用Python实现。

本次实验中对数据预处理和绘图的经历有一定的借鉴意义。因此记录下来。

数据预处理

不同于其他插图,直方图只需要一列数据即可。表示的是这一列数据中各个数据出现的频率分布。

实验用的数据是微博数据,经过处理后得到了一系列微博用户的轨迹数据。

如图sum2是轨迹的数量,line是轨迹编号。

92db6a4b899551fbcc60b7738f4d5ab2.png

因为是不同用户的轨迹,因此有重复需要通过arcgis的汇总功能,以line为key,对sum2求和。Python的group_by函数也可以实现这个功能。

最终得到了轨迹的数量;绘制轨迹数的直方图,能够分析研究区域内轨迹被用户访问的频率。如果有一些访问频率过低的轨迹,那就属于无效数据,需要进行区分。

绘制直方图

1,Excel绘制

数据导出为excel表格格式。选中一列数据,然后插入直方图。

f133c6e887c74d28c7803b26b2ee1dc3.png

初始化的图下标不是很合适。可以点击x轴,选择“设置坐标轴”菜单。在箱宽度中可以设置箱的宽度,即直方图的组距。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值