Pandas库常用命令汇总——自用备查(挖坑,持续更新)

本文汇总了Pandas库中常用的数据操作命令,包括数据导入、查看、填充缺失值、数据分组、聚合以及删除操作等,旨在为数据分析提供便利。重点介绍了fillna()方法用于填充缺失值,groupby()命令用于数据分组,以及agg()、transform()和apply()命令在数据聚合中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

引入库(数据分析常用三件套)

读取文件(excel、csv)

查看数据集

填充缺失值

查看,截取(切片)数据集

分组:groupby命令

聚合:agg命令

聚合:transform命令

聚合:apply命令

删除操作

导出文件


引入库(数据分析常用三件套)

import pandas as pd

import numpy as np

from matplotlib import pyplot as plt

%matplotlib inline

读取文件(excel、csv)

//读取excel文件

data = pd.read_excel("C:\del\desktop\111.xlsx",sheet_name="Sheet1")

//读取csv文件

data = pd.read_csv("Data_Path")

Tips:注意,由于python语言会将“\”当作转义字符,因此在填写文件地址时,一定要将“\”字符转换成“/”,特别是当出现下面这个报错的时候,那就是地址写错了!!!

SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escapec

查看数据集

df.head(10)  //查看前10行的数据
df.shape    //显示数据集的大小,如行和列的总数
df.info()   //查看每个变量的数据类型,返回变量、数据类型、内存使用量和关于每个变量的缺失值情况

也可以使用isnull方法检查 "Age" 和 "Cabin" 两列中缺失的数值

 

填充缺失值

很多时候我们需要将缺失值替换成有效的数值。
虽然可以通过 isnull() 方法建立掩码来填充缺失值,但是 Pandas 为此专门提供了一个fillna() 方法,它将返回填充了缺失值后的数组副本。

用一个单独的值来填充缺失值:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值