pandas库的基本用法

最新推荐文章于 2024-02-27 19:47:27 发布

原创最新推荐文章于 2024-02-27 19:47:27 发布 · 458 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#pandas

pandas 专栏收录该内容

7 篇文章

订阅专栏

一.使用pandas库读取一个CSV文件，并根据条件筛选数据

# coding=utf-8
import pandas as pd

# 读取CSV文件，假设文件名为'dogNames2.csv'，文件路径为当前目录
# 使用pandas的read_csv函数读取CSV文件，返回一个DataFrame对象
df = pd.read_csv('./dogNames2.csv')

# 打印出Count_AnimalName列中值大于800且小于1000的行
# 这里使用了布尔索引，&是逻辑与运算符
# df['Count_AnimalName'] > 800 返回一个布尔序列，表示Count_AnimalName列中每个元素是否大于800
# df['Count_AnimalName'] < 1000 返回一个布尔序列，表示Count_AnimalName列中每个元素是否小于1000
# 将这两个布尔序列进行逻辑与运算，得到一个布尔序列，表示Count_AnimalName列中每个元素是否同时满足大于800且小于1000的条件
# 最后，将这个布尔序列传递给df[]，只选择满足条件的行
print(df[(df['Count_AnimalName'] > 800) & (df['Count_AnimalName'] < 1000)])

这段代码首先读取了一个名为dogNames2.csv的CSV文件，并将其转换为一个pandas的DataFrame对象。然后，它筛选出Count_AnimalName列中值大于800且小于1000的所有行，并打印这些行。

二.下面这段代码首先导入了pandas库，并使用它来读取一个CSV文件。然后，它对DataFrame进行排序，并打印出排序后的前5行。接着，它演示了如何使用pandas取行或列，以及注意事项。

# coding=utf-8
import pandas as pd

# 读取CSV文件，假设文件名为'dogNames2.csv'，文件路径为当前目录
df = pd.read_csv('./dogNames2.csv')

# 打印出DataFrame的前5行
# print(df.head())

# 打印出DataFrame的信息，包括索引、数据类型、内存使用等
# print(df.info())

# 按照'Count_AnimalName'列的值进行降序排序
df = df.sort_values(by='Count_AnimalName', ascending=False)

# 打印排序后DataFrame的前5行
# print(df.head(5))

# pandas取行或列的注意点
# 1. 方括号写数组，表示取行，对行进行操作
# 2. 写字符串，表示取列索引，对列进行操作

# 取DataFrame的前20行
print(df[:20])

# 取'Row_Labels'列
print(df['Row_Labels'])

# 打印'Row_Labels'列的数据类型
print(type(df['Row_Labels']))

在这段代码中，我们首先读取了一个CSV文件并创建了一个DataFrame。然后，我们按照Count_AnimalName列的值对DataFrame进行了降序排序。接下来，我们使用方括号[]来取行和列。如果在方括号中写入一个整数或整数数组，我们将取行；如果写入一个字符串，我们将取列。最后，我们打印了前20行，Row_Labels列，并打印了Row_Labels列的数据类型，它是一个pandas的Series对象。

下面为代码涉及到的csv文件

dogNames2文件大小：55.3 K|https://wwt.lanzoum.com/inxjH1o61c0f