17、地图绘制:数据可视化的有效途径

地图绘制:数据可视化的有效途径

在数据可视化领域,地图是展示空间数据的重要工具。然而,在使用地图进行数据呈现时,我们需要谨慎处理各种细节,以确保结果准确且具有可读性。

数据处理与地图绘制的挑战

在处理一些涉及枪支自杀等数据时,我们会遇到数据报告方面的问题。例如,对于一个有10万居民且一年发生9起枪支相关自杀事件的县,疾病控制与预防中心(CDC)不会报告这个数字,而是将其编码为“压制”,并提示任何标准化估计或比率都不可靠。如果我们为了绘制一张所有县都有颜色填充的地图,可能会想把这些被压制的结果归为最低类别,比如编码为零。但这是不可取的,一种标准的替代方法是使用计数模型来估计这些被压制的观测值,这可能会自然地引导我们对数据进行更广泛、更合适的空间建模。

同样,对于一个有10万居民且一年发生12起枪支相关自杀事件的县,虽然CDC会报告绝对死亡人数,但也会警告用这个数字计算的比率不可靠。如果我们忽略这个警告进行计算,可能会使人口稀少的县在自杀率类别中处于最高类别,而略低于阈值的低人口县则被编码为最低类别,但实际上它们可能并没有那么大的差异,而且量化这种差异的努力也不可靠。如果无法直接获得这些县的估计值或用一个好的模型进行估计,那么最好将这些情况视为缺失值,即使这会影响地图的美观,也比用不可靠的数字给大片区域上色要好。

小的报告差异、粗糙的分箱和错误编码会产生空间误导和实质性的错误结果。这些看似细微的变量编码细节,实际上会极大地改变任何图表,尤其是地图的外观,而且事后很难察觉。

Statebins的使用

作为州级等值区域图的替代方案,我们可以考虑使用由Bob Rudis开发的statebins包。它类似于ggplot,但语法略

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值