pandas中一些常用的工具

本文详细介绍了Pandas库中五个核心函数的使用方法,包括value_counts()用于统计不同值的数量,iloc()和loc()用于数据切分与选择,sort_values()进行数据排序,以及drop()用于删除指定行列数据。这些函数是进行数据分析与处理的基础。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  • 注意这些都必须是在pandas中的DataFrame使用
  • 第一个:value_counts()

Series.value_counts(normalize=Falsesort=Trueascending=Falsebins=Nonedropna=True)

Returns object containing counts of unique values.

简单地说:看看数据中有哪些不同的值,并计算每个值有多少个重复值

 

  • 第二个:iloc()

切分数据

比如:  label=y_train.iloc[0]       上式的作用切分y_train中第一行的数据给label.

             label=y_train.iloc[:,-1]          把y_train中数据最后一列给label

  • 第三个 sort_values()

DataFrame.sort_values(byaxis=0ascending=Trueinplace=Falsekind='quicksort'na_position='last')

>>> df = pd.DataFrame({
...     'col1' : ['A', 'A', 'B', np.nan, 'D', 'C'],
...     'col2' : [2, 1, 9, 8, 7, 4],
...     'col3': [0, 1, 9, 4, 2, 3],
... })
>>> df
    col1 col2 col3
0   A    2    0
1   A    1    1
2   B    9    9
3   NaN  8    4
4   D    7    2
5   C    4    3
>>> df.sort_values(by='col1', ascending=False)   # 根据col1来下降排序
    col1 col2 col3
4   D    7    2
5   C    4    3
2   B    9    9
0   A    2    0
1   A    1    1
3   NaN  8    4

 

第四个:index

 

第五个:loc()

selection by label(根据标签删除数据)

 参考网页

第六个:drop()

删掉某列某行数据

参考网页

 

 

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值