DataFrame相关

最新推荐文章于 2025-10-27 11:40:51 发布

原创最新推荐文章于 2025-10-27 11:40:51 发布 · 5.5k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

python 专栏收录该内容

16 篇文章

订阅专栏

本文介绍了Python中Pandas库的DataFrame数据结构，包括如何构建DataFrame，数据选取的方法如按位置、列名、索引选择，以及DataFrame的统计操作如描述性统计、信息查看、空值统计和条件筛选。此外，还提到了分组统计和数据过滤等高级操作。

dataframe是python中pandas中的一种数据结构。类似于表的一种结构。

构建dataframe数据。
import pandas
import numpy as np
from pandas import DataFrame
?#df=DataFrame([[1,2,3],[4,5,6]])
df = DataFrame(data=np.arange(16).reshape(4,4),columns=list(‘abcd’))
这里写图片描述
DataFrame(data=np.arange(16).reshape(4,4),columns=list(‘abcd’),index=list(‘ABCD’))

数据选取
df[0：1] 选取第一行按位置选取的 df[0] 这样是错误的的
df[‘a’] 选取第a列按列名选取

df.loc[0] 按index选取行 df.loc[0:3]选取0,1,2行 df.loc[‘A’] 选取索引为A的行
df.loc[[‘A’],’a’] 行列一起选

df.iloc[0,2] 只能通过位置来选择，选择第一行第三列
df.iloc[0:3,1:3]通过位置切片来选择可以选多的，也可以选中一个元素

df.at[1,’a’]通过名称来选择，只能选中一个
df.iat[1,2]通过位置来选择只能选中一个

df.ix[1] 通过位置来选取行 df.ix[‘A’]通过索引选择行
df.ix[1,’a’] 同时选取行列，位置和索引都可以可选中一个元素，也可以是多个

df选择后的数据基本都是dataframe结构，不能直接使用
使用df.values可以获取它的值

df.columns 输出列的信息

df.index 输出索引相关信息

df.describe() 会显示每一列的总数均值等
这里写图片描述
df.info() 显示基本的数据信息
df.count() df.mean() df.max() df.min() 统计每一列的统计量
df.head(10) 输出前10行 df.tail(10) 输出最后10行

df.isnull.sum() 按列统计表中的空值的数量
df.where(df>10).count() 按列统计表中大于10的元素个数
df.groupby(‘y’).count() 根据y属性进行分组，统计每一组的分布情况

df[df[‘price’]<’7.2’] 把符合条件的行显示出来
df.where(df[‘price’]<’7.2’) 所有行都显示，不符合条件的price显示为nan

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。