pandas - 基本数据操作

本文详细介绍使用Pandas处理股票数据的方法,包括读取CSV文件、索引操作、内容修改及排序技巧。涵盖直接索引、loc/iloc/ix使用、修改数据、按涨跌幅或开盘价排序等关键步骤。

为了更好的理解这些基本操作,我们将读取一个真实的股票数据。

# 读取文件
data = pd.read_csv("./data/stock_day/stock_day.csv")

1 索引操作

Numpy当中我们已经讲过使用索引选取序列和切片选择,pandas也支持类似的操作,也可以直接使用列名、行名

称,甚至组合使用。

pandas的DataFrame的获取有三种形式

  • 直接使用行列索引(先列后行)
  • 结合loc或者iloc使用索引
  • 使用ix组合索引
# 通过行列索引
data['open'][['2018-02-27']]

# 使用loc
# loc:只能指定行列索引的名字
data.loc['2018-02-27':'2018-02-22', 'open']

# 使用iloc
# 使用iloc可以通过索引的下标去获取
data.iloc[0:100, 0:2].head()

# 使用ix进行下表和名称组合做引
data.ix[0:10, ['open', 'close']]
# 相当于
data[['close', 'open', 'high']][0:3]

不支持的操作

# 错误
data[['2018-02-27']]['open']
# 错误
data[:1, :2]

2 对于内容的操作

# 直接修改原来的值
data['close'] = 1
# 或者
data.close = 1

3 排序

排序有两种形式,一种对于索引进行排序,一种对于内容进行排序

  • 使用df.sort_values(默认是从小到大)
    • 单个键进行排序
    • 多个键进行排序
  • 使用df.sort_index给索引进行排序
# 按照涨跌幅大小进行排序 , 使用ascending指定按照大小排序
data = data.sort_values(by='p_change', ascending=False)

# 按照两个键进行排序
data = data.sort_values(by=['open', 'high'])

# 对索引进行排序
data.sort_index()
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值