python数据分析学习之-pandas功能大纲

本文深入探讨Pandas库在数据处理中的应用,包括Series、DataFrame及Panel对象的基础使用,数据转换方法,如从CSV、字典、记录读取数据,以及高级功能如轴向链接、分组运算、聚合统计等。同时,介绍了Pandas在文件读写、数据索引、切片、矢量化字符串处理等方面的技术细节。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Pandas基础和应用

  1. 常用的数据对象
  1. Series对象-一维数组
pd.Series(data,index)

data可以是数组,列表,字典,index即为列名称

当data是字典时,列名称由key来充当

series有Index和value两个基本属性

  1. dataframe对象-二维数据
  1. 创建dataframe
pd.DataFrame(data,index,columns)

data可以是嵌套列表,二维数组,字典,或dataframe对象

index是索引对象,类数组对象

columns是列索引

  1. 数据转换

包括从csv,dict,items,records

  1. Panel对象-三维数据
pd.Panel(data,items,major_axis,minor_axis)

data可以是三维数组,嵌套列表,字典等。

items axis=0

major axis=1

minot axis=2

  1. 索引对象
  1. Index对象
创建索引pd.Index(["yuwen","shuxue"])
  1. Multiindex
  1. 数据索引和切片

Series.iloc[1]按位置读取

Series.loc[1:3]

  1. Dataframe转为numpy

Dataframe.vaues即可,切片方式基本与二维数组一致

  1. 文件读写操作

可以直接读csv,安装模块去读hdf5(大文件)

  1. 轴向链接
  2. 合并函数
  3. 按条件选择np.where.a.combine_first
  4. 分组运算(split apply combine)
df.groupby("cs").sum
聚合多种统计与运算
df.groupby("cs").aggregate(["mean","sum"])

filter过滤

transform 改变了原数据的值

  1. apply

apply 增加一列,参数是函数

  1. 矢量化字符串
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值