金融和经济数据应用

你如何利用本章中的工具去解决金融领域中的一些特殊问题。跟其他领域和分析领域一样,在数据规整化方面所花费的警力常常会比解决核心建模和研究问题所花费的要多得多。

1.数据规整化方面的话题

1.1 时间序列以及截面对齐
在处理金融数据时,最费神的一个问题就是所谓的”数据对齐”(data alignment)问题。手工处理数据对齐问题是一件令人非常郁闷的工作,而验证数据是否对齐则还要更郁闷些。不仅如此,合并未对齐的数据还很有可能带来各种bug。
pandas可以在算术运算中自动对齐数据。在实际工作中,这不仅能为你带来极大的自由度,而且还能提高你的工作效率。

1.2 频率不同的时间序列的运算
经济学时间序列常常有着按年、季、月、日计算的或其他更特殊的频率。有些完全就是不规则的,比如说,盈利预测调整随时都可能会发生。频率转换和重对齐的两大主要工具是resample和reindex方法。resample用于将数据转换到固定频率,而reindex则用于使数据符合一个新索引。

1.2.1. 我们可以用ts1 = Series(freq = ‘W-WED’),从一个星期的采样频率转换为一个工作日的采样频率ts1.resample(‘B’),这样则那些没有数据的日子就会出现一个”空洞”,只需要将fill_method设置为’ffill’即可用前面的值填充这些空白。

1.2.2 但是对于更一般化的不规整时间序列可能就不太合适了。如果要将ts1中”最当前”的值(即前向填充)加到ts2上。一个办法是将两者重采样为规整频率后再相加,但是如果想维持ts2中的日期索引的话,则reindex会是一种更好的解决方案。ts1.reindex(ts2.index,method=’ffill’)

1.3 时间和最当前数据选取
1.3.1 先生成一个交易日内的日期范围和时间序列。利用pthon的datatime.time对象进行索引即可抽取这些时间点上的值:ts[time(10,0)],实际上,该操作用到了实例方法at_time:ts.a

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值