快速入门Pandas

本文是Pandas的入门基础,介绍其两大核心数据结构——Series和DataFrame。Series是一维数组对象,类似定长有序字典,可自定义索引;DataFrame是表格型数据结构,由多列不同类型的數據组成,支持属性访问和函数操作。内容涵盖数据结构创建、索引、缺失值处理、数据对齐及 DataFrame 的操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

思维导读

在这里插入图片描述

Pandas是专门为处理表格和混杂数据设计的。区别numpy,numpy是为了处理统一的数组数据的。

同样是分为两大部分来讲pandas,数据结构+操作,这边是入门基础,以后大量的数据分析都是使用pandas去完成的。

数据结构

两个基本的数据结构,Series,一维数组对象,DataFrame,二维数组对象
Series
创建
在这里插入图片描述
索引+值的配置是不是有点熟悉,你不设置索引,它也会自动生成索引

在这里插入图片描述

当然你也可以自己设定索引
在这里插入图片描述

没错,它的索引就是和你想象的是一样的
在这里插入图片描述
这边还有一个列表索引

##索引列表['a','d','c']
obj2[['a','d','c']]

它简直和numpy一维数组是一样的
在这里插入图片描述

其实到这里,你可以看出来,series其实就是一个定长的有序字典,许多字典函数也是可以使用的
在这里插入图片描述

也可以传入index的顺序,它会按照你传入的顺序进行排序
在这里插入图片描述
没有找到的话,会自动填入缺失符号
判断缺失值
在这里插入图片描述
自动对齐数据
在这里插入图片描述

name属性,很像表名
在这里插入图片描述

DataFrame
表格型的数据结构,一组有序的列组成;如何创建DataFrame
在这里插入图片描述

看代码就知道这是一列一列的数据组成的,他们可以是不同类型的

设定index,columns
在这里插入图片描述
属性访问,就是索引,类似字典+自带的方法
在这里插入图片描述
访问行就需要函数啦
在这里插入图片描述

关于赋值的问题
在这里插入图片描述

在这里插入图片描述

创建和删除新列
在这里插入图片描述

注意索引返回的都是视图,修改会改变源数据的

嵌套词典创建dataframe
在这里插入图片描述

在这里插入图片描述

dataframe能够接受的数据
在这里插入图片描述

如果设置了DataFrame的index和columns的name属性,则这些信息也会被显示出来
在这里插入图片描述

跟Series⼀样, values属性也会以⼆维ndarray的形式返回DataFrame中的数据
在这里插入图片描述

到这里两种基本的数据结构就讲完了

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值