你是否遇到过这种情况,面对大规模数据集时,数据密集重叠,无法查看?今天给大家分享一款工具,正好可以解决这个问题。
图表详解
六边形热图(Hexagonal Heatmap)也称六边形分箱图(Hexagonal Binning),是一种由六边形为主要元素构成的统计图表。它既是散点图的延伸,又兼具直方图(频数统计)和热图(按值着色)的特征。
当需要分析变量之间的关系时,通常人们习惯用散点图来呈现,外加拟合线以寻找趋势。但是,随着数据集越来越大,图形中的散点也越来越多,数据点不可避免会密集重叠在一起、以至于很难分辨出趋势、发现聚类特征。
那么,如何解决上述问题呢?我们可以引入“密度”的概念,即以特定的数值区域为单位,统计这个区域里散点出现的频数,然后借鉴热图的特征,用不同的颜色代表频数的高低。这样一来,