Julia 数据处理与统计分析实战
1. 数据绘图与 DataFrame 基础
在数据处理中,我们可以通过绘图来直观展示数据特征。例如,尝试绘制 diff(ts4)
、 moving(mean, ts4, 4)
和 upto(sum, diff(ts4))
的图表,以观察六只股票的表现,相关内容可在 Jupyter 工作簿中查看。
TimeArray 包遵循 Julia Tables 接口,这使得从时间序列创建 DataFrame 变得十分容易,示例代码如下:
using DataFrames
DataFrame(ts4)
这里的 DataFrame 就像是一个矩阵,每列数据类型相同但列与列之间可能不同,并且可以通过列名引用,类似于 Excel 工作表。
2. 处理 Excel 电子表格
处理 Excel 电子表格时,可使用 XLSX 包。以 iris.xlsx
文件为例,它包含了鸢尾花数据集,该数据集于 1936 年由著名统计学家 Ronald Fisher 首次发表,包含三种鸢尾花(setosa、virginia 和 versicolor)各 50 个样本,测量了萼片长度、宽度以及花瓣长度、宽度等特征,所有值以厘米为单位。
操作步骤如下:
1. 导入 XLSX 包并读取文件:
import XLSX
xf =