pandas dataframe函数_Joyful-Pandas 学习笔记(1)——Pandas 基础

本文用于复习pandas相关代码。

代码取自Datawhale仓库

joyful pandas​github.com

首先要安装Pandas 版本在1.0.1以上

import 

查看Pandas版本

pd

csv/txt/xlsx文件读取

df 

这里要注意读取excel文件要先安装xlrd包

# Anaconda用户

将数据保存回csv/xlsx(写入)

df

保存回xlsx要先安装openpyxl包

# Anaconda用户

教程里面没有保存成txt的,这里挖个坑,有空再填

Pandas基本数据结构

Series

对于一个Series,其中最常用的属性为值(values),索引(index),名字(name),类型(dtype)

s 

0da6a7294fe3961fbd640da9b4aff7d5.png

Series相当于一个列向量,包含值,列坐标和向量名。

访问Series的四个属性——值(values),索引(index),名字(name),类型(dtype)

s

取出Series的某一个元素,根据索引index来提取

c02a9f186556e99540edcb353d9ebcf8.png

调用某些函数进行计算,如求平均值

fe4a426bc6cf196ab8fdf0338d20745f.png

DataFrame

相较于Series的列向量,DataFrame就像是完整的一个列表

这里一定要注意DataFrame的DF都需要大写,牢记!

创建一个Dataframe

df 

2f8f475fe81348a2f2cd3c8fd638dd44.png

可以看到DataFrame的基本组成要有列名,每一列有什么和index

从DataFrame取出一列为Series

1813cd54897e812fad7c90d74c2c7ebb.png

方法和数组是类似的,使用df['列名']的方法

修改行名或列名

df

使用rename函数

b9de443bae3ae75a8109a10f7f88e44c.png

类似地,也有调用属性的方法

340e1db5a1285bbd56d801572c965bfd.png

索引对齐特性

这是Pandas中非常强大的特性,不理解这一特性有时就会造成一些麻烦

c0686cb50ba98fcc31adae2bdb723ffb.png

是index对应的元素相减

列的删除与添加

删除使用drop/del/pop函数

df

5bc3ad1d18f16b622e71deca2797cf35.png

1880e5a42af0612e7487b66327b73307.png

drop函数可以指定行名和列名,删除对应的行列,但不会影响原DataFrame,如果在drop中设置inplace=True后会直接在原DataFrame中改动

del函数指定列名直接删除原DataFrame对应的列,会改变原DataFrame

pop函数英文上是冒出泡泡的意思,所以你是把不要的东西冒出来,因此pop函数指定列名,直接输出该列,同时也会改变原DataFrame

增加新列

直接指定列名增加,也可使用assgin函数,增加一个Series

d292edc53f256da90e6a7f407dba60e8.png

根据数据类型选择对应的列

615005010d6137cd2120c989fc70a72b.png

将Series转换为DataFrame

61954bb8f019f4b639980b9542bca20a.png

使用T符号可以转置

67696aebf2cf9ec5e8b38ad33d8214da.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值