数据可视化:类型、经典案例与实用技巧
1. 图表类型
- 累积分布函数(CDF) :绘制CDF的一大优点是它不依赖于分箱计数参数,能呈现数据的真实面貌。对于n个观测值,CDF以包含n + 2个点的线图形式绘制。第一个点是(xmin - ϵ, 0),最后一个点是(xmax + ϵ, 1)。将观测值排序得到S = {s1, …, sn},然后绘制(si, i/n)。与直方图相比,CDF更难解读,它单调递增,没有峰值,众数由最长的垂直线段标记。但CDF能更好地突出分布的尾部,因为直方图中尾部的小计数被坐标轴遮挡,而在CDF中会累积成可见的部分。
- 数据地图 :
- 传统数据地图 :利用区域的空间排列来表示地点、概念或事物。传统数据地图通过颜色或阴影突出显示地图中区域的属性。例如,2012年美国总统大选的数据地图(左图),根据各州投票给奥巴马(蓝色)或其对手罗姆尼(红色)的情况对各州进行着色,清晰展示了美国的政治分歧。
- 非地理区域地图 :地图不限于地理区域,化学元素周期表是科学可视化历史上最强大的地图之一。它将元素映射到逻辑分组中,反映化学性质。相连的区域显示了金属和惰性气体的位置,以及未发现元素可能存在的位置。
- 元素周期表的强大之处 :
- 有故事可讲 :地图编码了值得参考或吸收的信息。元素周期表由于电子壳层的结构及其对化学性质和键合的重要性,是元素的
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



