使用plt.hist()函数想要把数据转为密度直方图,但发现直接使用density=true得到的值很奇怪,y轴甚至会大于1,不符合我的预期。(原因应该是所有bar的面积之和是1, 要求概率,需要把计算得到的概率密度除以bar的宽度。)
查了资料发现density=ture的意思是保证该面积的积分为1,并不是概率和为1,因此我们需要对其进行改进。
最简单对方法就是对每个bin增加权重,强迫它为我们的概率值:
weights = np.ones_like(score_list)/float(len(score_list))
probabilities,bins,_ = plt.hist(score_list, weights=weights)
这样就可以保证y轴和为1了~
更多讨论参考这里
参考:https://blog.youkuaiyun.com/crazy_scott/article/details/84395239
在使用matplotlib的plt.hist()函数绘制密度直方图时,发现默认的density参数并不能得到期望的概率分布。实际上,density=True确保的是直方图的总面积为1,而非每个柱状图的y值和为1。解决方法是通过设置weights参数,根据数据长度进行归一化。通过weights=np.ones_like(score_list)/float(len(score_list)),我们可以得到y轴和为1的概率密度直方图,确保了概率的正确性。这种方法对于理解概率分布和数据可视化非常有用。
741

被折叠的 条评论
为什么被折叠?



