数据导入和整理模块---pandas

最新推荐文章于 2025-04-22 10:18:39 发布

落春只在无意间

最新推荐文章于 2025-04-22 10:18:39 发布

阅读量1.5k

点赞数

分类专栏： # Excel（用python操作）文章标签： python 爬虫 pandas

本文链接：https://blog.youkuaiyun.com/qq_39838607/article/details/120080118

版权

本文详细介绍了Python数据分析库Pandas的基础知识，包括创建Series和DataFrame，修改索引，读写文件，数据选取与处理，以及数据的合并与拼接。重点讲解了DataFrame的创建方式，如通过列表、字典和二维数组，以及如何重命名索引。此外，还阐述了数据的筛选、排序、运算和删除等操作，并展示了文件的读取和写入方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

pandas模块是基于NumPy模块的一个开源Python模块，广泛应用于完成数据快速分析、数据清洗和准备等工作，它的名字来源于“panel data”(面板数据)。

pandas模块提供了非常直观的数据结构及强大的数据管理和数据处理功能，某种程度上可以把pandas模块看成Python版的Excel。如果是利用Anaconda安装的Python，则自带pandas模块，无须单独安装。与NumPy模块相比，pandas模块更擅长处理二维数据，其主要有Series和DataFrame
两种数据结构。

(一)、`Series`创建一维数组

import pandas as pd

s = pd.Series(['丁一','王二','张三'])
print(s)

运行结果

0    丁一
1    王二
2    张三
dtype: object

看到s是一个一维数组结构，并且每个元素都有一个可以用来定位的行索引，
如s[1]可以定位到王二。

(二)、二维数组表格`DataFrame`的创建与索引的修改

一、`DataFrame`的创建

DataFrame 可以通过列表、字典或二维数组来创建。

1、通过列表来创建

利用pandas模块中的DataFrame()函数来创建

import pandas as pd

a = pd.DataFrame([[1,2],[3,4],[5,6]])
print(a)

运行结果

通过与NumPy模块创建的二维数组比较可以发现，DataFrame更像Excel中的二维表格，它也有行索引和列索引。需要注意的是，这里的索引序号是从0开始的。

我们还可以在创建DataFrame时自定义列索引和行索引，演示代码如下：

import pandas as pd

a = pd.DataFrame([[1,2],[3,4],[5,6]],columns=['date','score'],index=['A','B','C'])
print(a)

运行结果

   date  score
A     1      2
B     3      4
C     5      6

用列表来创建还有另一种方式，演示代码如下

import pandas as pd

a = pd.DataFrame()
date = [1,3,5]
score = [2,4,6]
a['date'] = date
a['score'] = score
print(a)

运行结果

   date  score
0     1      2
1     3      4
2     5      6

2、通过字典创建

默认以字典的键名作为列索引，演示代码如下：

import pandas as pd

a = pd.DataFrame({
   'a':[1,2,3],'b':[4,5,6]},index=['x','y','z'])
print(a)

运行结果

如果想以字典的键名作为行索引，可以用 from_dict()函数将字典转换成DataFrame,同时。设置参数orient的值为’index’。演示代码如下：

import pandas as pd

a = pd.DataFrame.from_dict({
   'a':[1,2,3],'b':[

最低0.47元/天解锁文章

数据导入和整理模块---pandas

pandas

前言

(一)、Series创建一维数组

(二)、二维数组表格DataFrame的创建与索引的修改

一、DataFrame的创建

1、通过列表来创建

2、通过字典创建

(一)、`Series`创建一维数组

(二)、二维数组表格`DataFrame`的创建与索引的修改

一、`DataFrame`的创建