数据可视化技术:以印度 COVID - 19 疫情为例
1. 数据可视化概述
在当今数字化时代,每天都会在互联网上产生海量数据。这些数据来源广泛,主要包括交易数据、社交媒体数据和机器生成数据,此外组织内部也会产生私有数据。随着互联网用户的增加,数据量呈爆炸式增长,预计到 2025 年,全球将产生 181 泽字节的数据。自 2019 年 COVID - 19 疫情爆发以来,数据使用量进一步增加。
然而,仅仅产生大量数据是不够的,关键是要以一种易于理解的方式来表示和使用这些数据,这就需要数据可视化。数据可视化是指使用图形表示来探索、解释和传达大量数据,它是数据科学的关键要素之一,有助于检测和分析原始数据中的有意义模式,并做出数据驱动的决策。
1.1 数据可视化的过程
数据可视化过程包含以下步骤:
graph LR
A[明确研究问题] --> B[数据获取]
B --> C[数据清洗]
C --> D[选择可视化技术和工具]
D --> E[数据准备]
E --> F[可视化与解释]
- 明确研究问题 :在创建可视化之前,需要明确数据可视化的目的,即要回答哪些研究问题,以避免出现可视化问题。例如,将所有参数放在一个图表中展示 COVID - 19 相关数据,会使图表难以阅读和理解。
- 数据获取 :这是数据收集或生成的过程,可以使用现有的数据,也可以根据特定需求收集数据
数据可视化:以印度新冠疫情为例
超级会员免费看
订阅专栏 解锁全文
4831

被折叠的 条评论
为什么被折叠?



