地图绘制:数据可视化的有效途径
在数据可视化领域,地图是展示空间数据的重要工具。然而,在使用地图进行数据呈现时,我们需要谨慎处理各种细节,以确保结果准确且具有可读性。
数据处理与地图绘制的挑战
在处理一些涉及枪支自杀等数据时,我们会遇到数据报告方面的问题。例如,对于一个有10万居民且一年发生9起枪支相关自杀事件的县,疾病控制与预防中心(CDC)不会报告这个数字,而是将其编码为“压制”,并提示任何标准化估计或比率都不可靠。如果我们为了绘制一张所有县都有颜色填充的地图,可能会想把这些被压制的结果归为最低类别,比如编码为零。但这是不可取的,一种标准的替代方法是使用计数模型来估计这些被压制的观测值,这可能会自然地引导我们对数据进行更广泛、更合适的空间建模。
同样,对于一个有10万居民且一年发生12起枪支相关自杀事件的县,虽然CDC会报告绝对死亡人数,但也会警告用这个数字计算的比率不可靠。如果我们忽略这个警告进行计算,可能会使人口稀少的县在自杀率类别中处于最高类别,而略低于阈值的低人口县则被编码为最低类别,但实际上它们可能并没有那么大的差异,而且量化这种差异的努力也不可靠。如果无法直接获得这些县的估计值或用一个好的模型进行估计,那么最好将这些情况视为缺失值,即使这会影响地图的美观,也比用不可靠的数字给大片区域上色要好。
小的报告差异、粗糙的分箱和错误编码会产生空间误导和实质性的错误结果。这些看似细微的变量编码细节,实际上会极大地改变任何图表,尤其是地图的外观,而且事后很难察觉。
Statebins的使用
作为州级等值区域图的替代方案,我们可以考虑使用由Bob Rudis开发的statebins包。它类似于ggplot,但语法略
超级会员免费看
订阅专栏 解锁全文
1048

被折叠的 条评论
为什么被折叠?



