数据转换、建模与可视化:深入解析与实践
1. 数据转换
1.1 数据转换示例
在数据分析中,数据转换是一项常见且重要的操作。例如,在绘制观测数量与平均值的关系图时,常常会看到类似的模式。以下是一个示例代码:
ggplot(filter(ba, ab >= 10), aes(ab, ba)) +
geom_bin2d() +
geom_smooth()
这个代码展示了如何对数据进行筛选和绘图,通过 filter 函数筛选出 ab 大于等于 10 的数据,然后使用 ggplot 进行可视化, geom_bin2d 用于绘制二维直方图, geom_smooth 用于添加平滑曲线。
1.2 相关练习
为了更好地掌握数据转换,这里提供了一些练习:
1. 对于 ggplot2movies::movies 数据集中的每一年,确定缺失预算的电影百分比,并进行可视化。
2. 探究电影平均长度随时间的变化情况,用包含不确定性展示的图表呈现结果。
3. 针对钻石的质量组合(如切割、颜色和净度),统计钻石数量、平均价格和平均尺寸,并进行可视化。
4. 使用 0.1 的组距手动计算克拉的直方图,使用 geom_bar(stat = "identity") 展示结果。
5. 在棒球示例中,为什么击球平均
超级会员免费看
订阅专栏 解锁全文
955

被折叠的 条评论
为什么被折叠?



