一、python直方图在数据量非常大的时候,横坐标容易变成一条黑线过于密集,如下图所示:

二、第一种解决方法,修改tick_spacing参数值,本人设置成300,结果如图所示:
三、根据二中结果,发现数据格式错误,不是数值型,检查一下.csv原始数据

excel中缺失值不是数值型,需要转化数据
1.删除空格
def delete_space(x):
if type(x) is str:
return x.strip()
else:
return x
b=df_WAGP.applymap(delete_space)
2.填补缺失值,尽量使用9999999这种值填补,不要跟实际值产生重叠
df_WAGP=b.fillna(value=9999999)
3.数据转化
b= np.array(df_data).flatten() #一维数组
b=pd.DataFrame(b)#转化数据框
b1=b.astype(np.float64)#转化数值型
b2= np.array(b1).flatten() #在转化成数组,否则做不出直方图
四、做直方图

当Python绘制直方图遇到数据量过大导致横坐标过于密集时,可以通过修改tick_spacing参数来改善。首先,检查数据中是否存在空格并用`delete_space`函数删除。然后,填充缺失值,使用9999999避免与实际值冲突。将数据转化为数值型,使用`astype`转换为float64,并确保数据格式正确。最后,绘制直方图,问题得以解决。
1401

被折叠的 条评论
为什么被折叠?



