2、 数据的规整。数据的规整化工作包括清理、转换、合并、重塑。主要目的是将获取的数据转化成我们需要的结构、格式和内容。为了做散点图,我们需要收盘价和成交量两列数据,前面的代码已经实现。做折线图,需要以成交量做索引、收盘价做值的series。分别做3个series,即后5日的、倒数第10日到倒数第5日的、倒数第15日到倒数第10日的。所涉及的知识点如下。
a)从DataFrame中获取符合条件的数据。如从df中获取stockname(股票名称)为‘三全食品’的数据, df[df[‘stockname’]=’三全食品’],其中df[‘stockname’]=’三全食品’将获得一个布尔数 组,通过它得到符合条件的数据。
b)从DataFrame中获取指定的列。获取一个列名为‘closeing’的指定的列,df[‘closeing’]。获 取两个列名分别为’closeing’,’volume’的指定的列,df[['closeing','volume'] 。
c)从DataFrame中获取一个以’closeing’列的数据为值、以’volume’列的数据为索引的series。 一种方法是用set_index,将某一列设置为索引,另一种方法是用构建series的方法,例如 srs1=Series(df['closeing'].values,index=df['volume'].values)。
下面是实现数据规整化的代码:
srs1=Series(df['closeing'].values[-5:],index=df['volume'].values[-5:])
srs2=Series(df['closeing'].values[-10:-4],index=df['volume'].values[-10:-4])
srs3=Series(df['closeing'].values[-15:-9],index=df['volume'].values[-15:-9])