直方图的使用与操作详解
1. 直方图比较问题与解决思路
在处理不同气象站的直方图数据时,会遇到一些问题。不同气象站对于直方图的定义可能不一致,而且测量时间间隔也可能不同,这就导致直方图的条目数量有较大差异。如果我们只关注降雨分布的规律,该如何比较不同气象站的结果呢?解决办法是对所有直方图进行以下操作:
1. 归一化
2. 平移
3. 去除区间依赖
归一化问题相对明显,可以使用之前讨论的方法完成。而如何找到水平平移量是一个尚未明确的问题,后续会在统计检验相关内容中进行探讨。
2. 一维直方图
2.1 概率分布与概率密度
从直方图中可以导出几个重要的量。通过将直方图的条目数除以总条目数,可以得到概率分布。而概率密度则是将概率分布除以区间宽度,使得所有矩形的总面积为 1,这也是概率密度的定义。
可以通过以下代码获取概率分布和概率密度:
>>> h2=h1.getProbability()
>>> h2=h1.getDensity()
上述代码会返回两个新的 H1D 对象,第一个代表概率分布,第二个返回概率密度。这种方法不仅简单,而且对于可变区间大小的直方图非常有用,因为在除以区间宽度时会自动考虑这种情况。
如果事先知道事件的总数(或条目数)$N_{tot}$,可以节省计算概率分布的时间。可以在 fill(x,w1)
方法中使用权重 $w_1 = 1.0/N_{tot}$,而无需后续调用