实际遇到的问题:
在CSV文件当中或者数据库当的数据通常以长格式或者(stacked)堆叠格式存储,特别是金融数据中出现的时间序列数据,例如:
In [1]: df
Out[1]:
date variable value
0 2000-01-03 A 0.469112
1 2000-01-04 A -0.282863
2 2000-01-05 A -1.509059
3 2000-01-03 B -1.135632
4 2000-01-04 B 1.212112
5 2000-01-05 B -0.173215
6 2000-01-03 C 0.119209
7 2000-01-04 C -1.044236
8 2000-01-05 C

本文探讨了如何将CSV或数据库中常见的堆叠格式数据转换为以日期为索引,A、B、C、D为列名的DataFrame,适合进行时间序列分析。通过介绍data reshaping的概念,重点讲解了Pandas的pivot()函数,该函数可以高效地完成数据重塑,尤其适用于需要将每个变量作为单独列的情况。示例中展示了如何利用pivot()进行操作,并展示了层次化列的处理方法。
最低0.47元/天 解锁文章
617

被折叠的 条评论
为什么被折叠?



