前言
最近接到一个任务,来绘制一组数据的频率分布直方图。直方图是高中就学习过的知识,但是在科研、数据分析中仍然占有很高的地位。一开始我认为这个只需要用Excel就可以轻松实现,但是对Excel的绘图不熟悉,折腾了半天才用Python实现。
本次实验中对数据预处理和绘图的经历有一定的借鉴意义。因此记录下来。
数据预处理
不同于其他插图,直方图只需要一列数据即可。表示的是这一列数据中各个数据出现的频率分布。
实验用的数据是微博数据,经过处理后得到了一系列微博用户的轨迹数据。
如图sum2是轨迹的数量,line是轨迹编号。

因为是不同用户的轨迹,因此有重复需要通过arcgis的汇总功能,以line为key,对sum2求和。Python的group_by函数也可以实现这个功能。
最终得到了轨迹的数量;绘制轨迹数的直方图,能够分析研究区域内轨迹被用户访问的频率。如果有一些访问频率过低的轨迹,那就属于无效数据,需要进行区分。
绘制直方图
1,Excel绘制
数据导出为excel表格格式。选中一列数据,然后插入直方图。

初始化的图下标不是很合适。可以点击x轴,选择“设置坐标轴”菜单。在箱宽度中可以设置箱的宽度,即直方图的组距。

本文介绍了如何使用Python绘制频率分布直方图,包括数据预处理和使用matplotlib库绘制直方图的过程。通过去除0值并调整组距,分析微博用户轨迹数据的访问频率,为数据挖掘提供可视化支持。
最低0.47元/天 解锁文章
1150

被折叠的 条评论
为什么被折叠?



