pandas数据分析（1）

竹筒饭啊

已于 2024-07-02 18:45:41 修改

阅读量344

点赞数 5

分类专栏： Python+Excel 文章标签： pandas 数据分析

于 2024-06-29 15:38:11 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_42797317/article/details/140058242

版权

Python+Excel 专栏收录该内容

8 篇文章

订阅专栏

pandas，即Python数据分析库（Python data analysis library）

DataFrame和Series

DataFrame（数据帧）和Series（序列）是pandas的核心数据结构。DataFrame的主要组件包含索引、列、数据。DataFrame和二维的Numpy数组类似，但是它的行和列有对应的标签，并且每一列都可以存储不同类型的数据。从DataFrame中提取一行或一列时，会得到一个一维的Series。Series相当于带标签的一维Numpy数组。

读取Excel为DataFrame格式，首先导入pandas，然后使用read_excel函数通过Excel文件构造一个DataFrame。

不读取Excel，从头创建一个DataFrame。创建DataFrame的方法之一是利用嵌套列表来提供数据，除了数据本身外，还需要提供columns参数和index参数。

调用info方法可以获取DataFrame的一些基本信息，其中最重要的是数据点数量和每一列的数据类型：

索引

DataFrame的行标签被称为索引。如果找不到有意义的索引，构造DataFrame时可以直接省略，pandas会自动创建一个从0开始的整数索引。如下获取所有对象：

也可以给索引命名：

reset_index会将索引还原成普通索引，同时用默认用默认索引替换当前索引：

set_index可以将任意列设为索引：

DataFrame的方法返回的是副本：每当df.method_name()的形式调用DataFrame时，都会得到一个应用了该方法的DataFrame副本，而原来的DataFrame没有发生任何变化。如果想要改变原来的DataFrame，可以把返回值赋值给原来的变量：

df = df.reset_index()

用reindex方法更换索引：

reindex会接管所有能够怕匹配新索引的行，而无法匹配的索引会引入空值（NaN）。被忽略的索引所对应的行会被直接丢弃。

sort_index可以按索引进行排序：

如果想按一列或多列排序，可以使用sort_values。按多列排序时会先按前面的列排序，排序后的结果依次按后面的列排序:

博客等级

码龄7年

73
原创

275
点赞

250
收藏

211
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

测试111
竹筒饭啊: 太6了，我就觉得这浏览收藏点赞不太对劲，今天测出来估计都是人机。这种文章还有人点赞收藏？？？
动态语言特性
优快云-Ada助手: 推荐 Python入门技能树：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。