NLP(12): Pandas_

本文详细介绍了Pandas中的Series和DataFrame数据结构,包括它们的创建、自定义索引、缺失数据处理、运算及排序。还讨论了层次化索引在数据处理中的应用,并介绍了如何使用Pandas读取CSV和Excel文件,以及利用matplotlib进行数据可视化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第一节 初始Series

为什么学习pandas:
因为pandas含有使得数据分析工作变得更快和更简单的高级数据结构和操作工具
因为pandas时基于numpy来进行构建的,让以numpy为中心的应用变得更加的简单。

1、Series类型说明

这个就是一直类似于一堆数组的对象,它是由一组数据以及一组与之相关的数据标签索引组成(索引)。仅由一组数据即可产生最简单的series。

obj=Series([1,2,3,4,5)
obj.values
obj.index

2、自定义索引

obj=Series(["a","b","c"],index=[1,2,3])
obj[1]: "a"

3、series可以当作字典使用

data={"a":10000,"b"":1000,"c"":2000}
obj=Series(data)
keys=["a","c"]
obj_1=Series(data,index=keys)#只取出字典中对应a和c的values

4、对缺失数据的处理

data={“a”:None,"b":20000}
obj=Series(data)
pd.isnull(obj)#判断是否为空
obj.isnull()

5、指定series name和index name

obj.name=""
obj.index.name=""

第二节:初始Dataframe

是一个表格型的数据结构,含有一组有

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值