【Python-dataframe】excel简单操作

经常有需要用python脚本去处理excel做统计工作,那么pandas为统计工作的首选。下面来看下dataframe的简单操作。

获取指定行、列
row = df.iloc[3, :]  # 获取第4行
column = df.iloc[:, 3]  # 获取第4列
获取dataframe坐标值
value = data.iat[0,5]  # dataframe.iat[0,0]开始
行 or 列拼接
nc_df = pd.concat([gt_defect, infer_defect], axis=0)  # 垂直拼接gt_defect列 和 infer_defect列
去重,去空
nc = df.drop_duplicates().dropna()  # 去重, 去空, df为某一列
# nc = np.array(nc).tolist()  # dataframe --> list
从df中筛选出a列中包含string的所有行(不包含空行), return dataframe
data = df[df['a'].str.contains('string', na=False)]
data = type_not_null[type_not_null[pic_or_product_level].astype(str).str.contains(i, na=False)]  # i为数字的话,需要这样筛选
获取dataframe行数
total_rows = len(df.index)
去掉 type 列空行
type_not_null = df[df['type'].notnull()]  # 保留空行为isnull()
list中某元素的数量
model_loushi = one_list.count('loushi')
dataframe新增列
df['pic_name'] = df['a'].map(str) + '-' + df['b'].map(str) + '-' + df['c'].map(str)  # 将a,b,c三列拼接成为一列命名为pic_name放在dataframe最后一列
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值