pandas对时间索引进行分割(truncate requires a sorted index)

本文探讨了在Pandas中使用truncate方法进行时间序列数据截取时的注意事项,包括索引排序的重要性及与loc切片方法的区别。通过实例说明如何正确截取近1个月、3个月或6个月的数据进行统计分析。

情景

开发时碰到需要截取近1个月,近3个月,近6个月的数据,进行统计分析
使用truncatedf进行数据集截取,遇到截取数据不符合预期,且若时间序列无序会抛出异常

挖一挖

  • 使用truncate时的索引必须先进行排序,不然会报错truncate requires a sorted index
  • 源码一进truncate方法就会检测index是否经过排序,没有排序,报错pandas truncate 方法源码
  • 极端情况,若时间序列只有两个的时候不会报错,但是结果会不符合预期不和预期图片
    预期是截取掉2018-08-24之后的数据,结果却正好相反,保留了2018-08-24之后的数据 排序之后再截取,就是预期的结果了

再挖一挖

truncateloc切片方法的切别: truncate未指定的话默认0值,loc分片未指定的话默认部分匹配源码注释truncate vs loc

  • 同是截取掉2018-08-31之后的数据
  • truncate,默认值为0,截取至“2018-08-31 00:00:00”(包含该值)
    只包含”2018-08-31 00:00:00“
  • loc,只要匹配上就行,只要是“2018-08-31”的都匹配上
    包含“2018-08-31”全天的值

作者:Chihwei_hsu
来源:http://chihweihsu.com
Github:https://github.com/HsuChihwei


评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值