这个例子比较适合数据挖掘入门一段时间。都还是比较基础的一些函数的应用。
环境和数据
这里使用的是pycharm2020.1.1 x64的
一般都是用的是Python 3.7.3
一些包就自己看着下
处理的数据 -appl_1980_2014.csv,如下图

题目
(1) 读取数据并存为一个名叫 apple 的数据框。
(2) 查看每一列的数据类型。
(3)将 Date 这个列转换为 datetime 类型。
(4)将 Date 设置为索引。
(5)有重复的日期吗?
(6)将 index 设置为升序。
(7)找到每个月的最后一个交易日(businessday)。
(8)数据集中最早的日期和最晚的日期相差多少天?
(9)在数据中一共有多少个月?
(10)按照时间顺序可视化 Adj Close 值。
代码
# 1. 读取数据并存为一个名叫 apple 的数据框。
apple = pd.read_csv(./data/appl_1980_2014.csv')
#(2)查看每一列的数据类型。
print(apple.dtypes)
#(3)将 Date 这个列转换为 datetime 类型。
apple.Date=pd.to_datetime(apple['Date'])
print(apple.Date)
#(4)将 Date 设置为索引。
apple=apple.set_index('Date')
print(apple)
#(5)有重复的日期吗?
print(apple.i

这篇博客通过Python分析了Apple公司1980年至2014年的股价数据。内容包括数据读取、数据类型检查、日期转换、设置datetime索引、查找重复日期、按月份排序、找到每月最后一个交易日、计算日期差值、确定数据中的总月份数以及Adj Close值的时间序列可视化。使用了pandas库中的describe()、set_index()等函数,并探讨了iloc、loc和ix的区别。
最低0.47元/天 解锁文章
4968

被折叠的 条评论
为什么被折叠?



