pandas 时间序列的时间读取

本文分享了使用Pandas库高效读取CSV文件的方法,通过设置index_col和parse_dates参数,将索引列设为'No',并解析日期时间列,避免了默认索引的重复,提升了数据处理的效率。

发现了一个 pandas 读取 csv 的高级用法,下面直接读取一个 csv 文件:

path = 'PRSA_data_2010.1.1-2014.12.31.csv'
data = pd.read_csv(path)
data.head()

在这里插入图片描述
数据的年月日时是在不同列的,而且数据自带了第一列索引,和 pandas 的默认索引重复了。

下面改用高级读法:

df = pd.read_csv(path, index_col='No', 
                 parse_dates={'datetime': [1,2,3,4]},
                 date_parser=lambda x: pd.datetime.strptime(x, '%Y %m %d %H')
                )
df.head()

在这里插入图片描述
是不是舒服多了!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

颹蕭蕭

白嫖?

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值