23.3 数据预处理
在数据科学和分析中,数据预处理通常包括对原始数据的清理、转换、以及处理缺失值等步骤,以便后续的分析和建模能够在干净、完整的数据基础上进行。本项目的数据预处理工作包括:
- 创建比特币价格向量并处理缺失值:代码中首先构建了一个每日比特币价格的向量,并处理了缺失数据,这是为了确保数据的连续性和完整性。
- 绘制折线图:通过绘制比特币价格的折线图,可以直观地展示处理后的数据,这也是数据预处理的一部分,目的是检查数据是否正确、合理,并发现潜在的问题。
(1)下面代码的功能是为2014年12月1日至2019年1月7日期间的每一天创建一个比特币价格向量。如果某天的数据缺失,用NaN填充,然后通过线性插值(用缺失值前后的平均值填充)的方法补全缺失的价格数据。
# 为每一天(从2014-12-01到2019-01-07)构建一个每日价格的向量
date = datetime.date(2014, 12, 1)
enddate = datetime.date(2019, 1, 7)
j = 0
BC_Prices = []
while date < enddate:
while Real_Price.index[j] < date:
j = j + 1