Pandas总结

最新推荐文章于 2024-08-26 22:31:41 发布

原创最新推荐文章于 2024-08-26 22:31:41 发布 · 348 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#pandas #python

python 专栏收录该内容

96 篇文章

订阅专栏

本文详细介绍Pandas库中Series和DataFrame的基本操作，包括创建、访问、算数运算、删除、修改等，同时还介绍了数据排序、访问及时间序列处理等内容。

1.基本数据结构

基本的数据结构Series和DataFrame。

DataFrame数据用Numpy的array保存，可通过DataFrame.values查看原始数据

DataFrame的每一行和每一列都是一个Series

(1)创建

pd.Series([4,2,3,4])

pd.DataFrame([np.random.randn(6,4),columns=list('ABCD'))

(2)访问

df.iloc[0]

df.A

df.ix['three']

df.shape(属性)

头几行和后几行

df.head(3)

df.tail(2)

访问行索引和列索引

df.index

df.columns

统计信息

df.describe()

相关系数与协方差：

cov,corr,corrwith。

(3)算数运算

自动对齐

（4）删除

删除列del

删除列或行drop

（5）修改

重新索引：reindex

插值处理：method

缺失值填充：fill_value

（6）函数应用和映射

行或列应用：frame.apply(f)

元素级应用：frame.applymap()

（7）缺失值处理

dropna

选项how,thresh

（8）层次化索引

unstack,stack,swaplevel,set_index,reset_index

2.数据排序

（1）名称排序

df.sort_index(axis=1,ascending=False)

（2）数值排序

df.sort_values(by='B')

3.数据访问

（1）访问行

df[3:5]

（2）访问列

df[['A','B','D']]

（3）某个元素

df.loc[3,'A']

df.iloc[3,0]

（4）布尔

df[df.C>0]

（5）添加

df['TAG']=['cat','dog','cat','cat','cat','dog']

（6）分组统计

df.groupby('TAG').sum()

（7）通过by选择一个或多个列排序

（8）排名

obj.rank()

选项average,min,max,first

4.时间序列

5.数据可视化

6.文件读写

（1）保存

df.to_csv()

（2）读取

pd.read_csv('data.csv',index_col=0)

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。