pandas之dataframe

本文介绍了如何在pandas中创建和操作DataFrame,包括通过df.loc[], df.iloc[]访问数据,以及如何新建行和列。同时,文章提醒读者注意,当涉及逐行运算时,DataFrame效率较低,推荐使用numpy进行优化。" 110766508,10293013,Python函数与模块详解,"['Python编程', '函数定义', '模块导入', '函数调用', '参数传递']

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

pandas之dataframe

建立 dataframe

访问dataframe数据

  • df.loc[,] , df.iloc[]
  • df[][]

新建行,列

实例

// A code block
import pandas as pd
import numpy as np
df = pd.read_csv('data.csv')
df = df.sort_values(['user','date'])
df_B = df[df['indc'] == 'B']
df_S = df[df['indc'] == 'S']
df['vol-sign'] = np.where(df['indc']=='B',df['vol'],-df['vol']
df['cde'] = df.groupby('user')['vol-sign'].cumsum()
\\data.csv
user,vol,prc,date,indc,cde
a01,42,72,2019.07.22,B,
a01,42,72,2019.07.20,B,
a01,42,72,2019.07.22,S,
a01,42,72,2019.07.22,B,
a02,42,72,2019.07.22,B,
a02,42,72,2019.07.22,B,
a02,42,72,2019.07.20,S,
a03,42,72,2019.07.22,B,
a03,42,72,2019.07.20,B,
a03,42,72,2019.07.22,S,
a03,42,72,2019.07.22,B,

注意

dataframe比较适合整体操作,需要进行逐行运算时,效率太低!
建议转回numpy操作。

比如对于问题:
for i in range(1,10000000):
df.iloc[i,3] = df.iloc[i-1,3]*df[i,1]+df[i,2]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值