学用python进行数据分析(2)

本文介绍如何使用Python Pandas进行数据规整化操作,包括数据的清理、转换、合并及重塑等步骤。重点讲解了如何从DataFrame中提取特定数据、列以及创建以某列为索引的Series,以便后续的数据分析与可视化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

2、  数据的规整。数据的规整化工作包括清理、转换、合并、重塑。主要目的是将获取的数据转化成我们需要的结构、格式和内容。为了做散点图,我们需要收盘价和成交量两列数据,前面的代码已经实现。做折线图,需要以成交量做索引、收盘价做值的series。分别做3个series,即后5日的、倒数第10日到倒数第5日的、倒数第15日到倒数第10日的。所涉及的知识点如下。

      a)从DataFrame中获取符合条件的数据。如从df中获取stockname(股票名称)为‘三全食品’的数据,         df[df[‘stockname’]=’三全食品’],其中df[‘stockname’]=’三全食品’将获得一个布尔数         组,通过它得到符合条件的数据。

      b)从DataFrame中获取指定的列。获取一个列名为‘closeing’的指定的列,df[‘closeing’]。获          取两个列名分别为’closeing’,’volume’的指定的列,df[['closeing','volume'] 。

      c)从DataFrame中获取一个以’closeing’列的数据为值、以’volume’列的数据为索引的series。         一种方法是用set_index,将某一列设置为索引,另一种方法是用构建series的方法,例如                 srs1=Series(df['closeing'].values,index=df['volume'].values)。

下面是实现数据规整化的代码:

srs1=Series(df['closeing'].values[-5:],index=df['volume'].values[-5:])

srs2=Series(df['closeing'].values[-10:-4],index=df['volume'].values[-10:-4])

srs3=Series(df['closeing'].values[-15:-9],index=df['volume'].values[-15:-9])

转载于:https://my.oschina.net/u/2282638/blog/806314

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值