Python中的数据框操作

本文详细介绍了使用Python的Pandas库进行DataFrame创建、拼接、删除等操作的方法,包括从字典或列表创建数据框,数据框之间的拼接,以及如何删除指定的行或列,适合初学者和进阶用户快速掌握Pandas数据处理技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、创建dataframe

  • 法一
dat = ({'id':[1,2,3], 'string': ['a', 'b','c']})
  • 法二(若已有现成的list)
dat = pd.DataFrame([n_clusters_start, score], columns = ["分类数", "得分"])
exclamationCount = lambda text: sum([1 for x in text if x == '!'])
EC = tweet.apply(lambda x:exclamationCount(x))
EC = EC.tolist()
questionMarkCount = lambda text: sum([1 for x in text if x == '?'])
QC = tweet.apply(lambda x:questionMarkCount(x))
QC = QC.tolist()
dat = pd.DataFrame({'EC':EC,'QC':QC})
eachLetterCount = lambda text,letter: sum([1 for x in text.lower() if x == letter])

FList = []
pattern = 'abcdefghijklmnopqrstuvwxyz'
j=0
for i in pattern:
  F = tweet.apply(lambda x:eachLetterCount(x,i))
  F = F.tolist()
  FList.append(F)

res = pd.DataFrame(FList)
res = res.transpose()

pattern = 'abcdefghijklmnopqrstuvwxyz'
name = []
for i in pattern:
  name.append("freqOf " + i)
res.columns = name

在这里插入图片描述

二、数据框拼接(ignore_index = True, 重新分配索引)

# 两种方式,concat、 append都可以
result = pd.concat([result1, result2], ignore_index = True) # 默认axis = 0 -> 粘贴行 
result = result1.append(result2, ignore_index = True) # 粘贴行

RF_eval = pd.concat([RF_eval, eval_raw], axis = 1) # 粘贴列

三、删掉列

RF_eval.drop(['raw'], axis = 1, inplace = True)

四、删掉行

dat = dat.drop(0)

五、提取行索引

index0 = res.index[res['label'] == 0].tolist()
X0 = X[index0] # X为矩阵
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值