pandas常用的方法(工作必备)

本文详细介绍了Pandas数据结构,包括Series和DataFrame的创建、数据读取与预处理、数据选择、数值操作、数据运算、时间序列处理、数据透视表、多表格拼接以及导出文件等核心功能。通过实例展示了Pandas在数据分析过程中的常用方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

一、Pandas数据结构

二、读取数据

三、数据预处理

四、数据选择

五、数值操作

六、数据运算

七、时间序列

八、数据透视表

九、多表格拼接

十、导出文件


一、Pandas数据结构

1、 import pandas as pd

       import numpy as np

       import matplotlib.pyplot as plt

2、S1=pd.Series(['a','b','c'])         series是一组数据与一组索引(行索引)组成的数据结构

3、S1=pd.Series(['a','b','c'],index=(1,3,4))       指定索引

4、S1=pd.Series({1:'a',2:'b',3:'c'})          用字典形式指定索引

5、S1.index() 返回索引

6、S1.values() 返回值

7、Df=pd.DataFrame(['a','b','c'])        

      dataframe是一组数据与两组索引(行列索引)组成的数据结构

8、Df=pd.DataFrame([['a','A'],['b','B'],['c','C']],columns=['小写','大写'],index=['一','二','三'])

      Columms 为列索引,index为行索引

9、pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyspider 清华镜像

10、data={ '小写':['a','b','c'],'大写':['A','B','C']}         传入字典

        Df=pd.DataFrame(data)

11、Df.index() df.columns()

二、读取数据

12、df=pd.read_excel (r'C:\user\...xlsx',sheet_name='sheet1') 或

       pd.read_excel (r'C:\user\...xlsx',sheet_name=0) 读取excel表

13、pd.read_excel(r'C:\user\...xlsx',index_col=0,header=0)

         index_col指定行索引,header指定列索引

14、pd.read_excel(r'C:\user\...xlsx',usecols=[0,1])    导入指定列,不能有index_col和header

15、pd.read_tablel(r'C:\user\...txt',sep=' ')     导入txt文件,sep指定分隔符是什么

16、df.head(2)      展示前两行,默认展示前5行

17、df.shape        显示数据几行几列,不包含行和列索引

18、df.info()        可查看表中数据的类型

19、df.describe()   可获得表中数值类型指端的分布值(和、平均值、方差等)

三、数据预处理

20、df.info()          可显示表中哪个数据为空

21、df.isnull()        方法可以判断哪个值是缺失值,如果缺失返回True,否则为False

22、df.dropna()      默认删除含缺失值的行

23、df.dropna(how='all')      删除全为空值的行,不全为空值的行不会删除

24、df.fillna(0)          用0填充所有空值

25、df.fillna({ '性别':'','年龄':'30'})        对性别列中空值填充男,年龄填充30

26、df.drop_duplicates()           默认对所有值进行重复值检查,保留第一行的值

27、df.drop_duplicates(subset='性别')       对性别列中重复值查询保留第一行

28、df.drop_duplicates(subset=['性别','公司'],keep='last')      对性别和公司两列查重

keep设置默认为first(保留第一个),可设置为last(保留最后一个) 或False(不部不保留)

29、df['ID'].dtype            

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

bigdata_pokison

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值