数据可视化:从数据处理到交互式绘图
1. 处理数据框和整洁数据
在数据处理中, DataFrames 包提供了一些便捷的操作,虽然有些尚未详细讨论,但值得了解。
1.1 排序和连接操作
可以使用 sort 和 sort! 函数对 DataFrame 的行进行排序。对于连接操作,可以使用一系列函数,如 innerjoin 和 outerjoin 。
1.2 处理缺失值
Julia 对缺失值提供了一流的支持, DataFrames 包提供了一系列处理包含缺失数据表格的函数。Julia 使用 Missing 类型的 missing 对象表示缺失数据,其中 dropmissing 函数有助于删除所有包含缺失值的行。
1.3 数据编码
在整洁的 DataFrame 中,列代表数据变量,通常每列包含一种数据类型的对象(不考虑 Missing )。在 Julia 中,可以使用不同的数据类型来表示数据,主要有以下三种对可视化有重要意义的变量类型:
- 分类变量 :描述一组无序的类别或组。例如,在鸢尾花数据集中, Species 列是分类变量。在 Julia 中,通常使用
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



