优化数据可视化:从理论到实践
1. 有效运用主题元素
在数据可视化中,主题元素的使用至关重要。它不仅能帮助我们固定设计元素,还能让我们更专注于数据本身。以 GSS 受访者年龄分布的小倍数图为例,我们可以通过一系列操作来创建一个有效的可视化图表。
首先,我们需要计算感兴趣年份的受访者平均年龄。由于 GSS 调查并非涵盖 1972 年以来的所有年份,我们选择大约每四年的数据进行分析。以下是具体的代码实现:
yrs <- c(seq(1972, 1988, 4), 1993, seq(1996, 2016, 4))
mean_age <- gss_lon %>%
filter(age %nin% NA && year %in% yrs) %>%
group_by(year) %>%
summarize(xbar = round(mean(age, na.rm = TRUE), 0))
mean_age$y <- 0.3
yr_labs <- data.frame(x = 85, y = 0.8,
year = yrs)
接下来,我们准备数据并设置图形元素:
p <- ggplot(data = subset(gss_lon, year %in% yrs),
mapping = aes(x = age))
p1 <- p + geom_density(fill = "gray20"
超级会员免费看
订阅专栏 解锁全文
1148

被折叠的 条评论
为什么被折叠?



