一.使用pandas库读取一个CSV文件,并根据条件筛选数据
# coding=utf-8
import pandas as pd
# 读取CSV文件,假设文件名为'dogNames2.csv',文件路径为当前目录
# 使用pandas的read_csv函数读取CSV文件,返回一个DataFrame对象
df = pd.read_csv('./dogNames2.csv')
# 打印出Count_AnimalName列中值大于800且小于1000的行
# 这里使用了布尔索引,&是逻辑与运算符
# df['Count_AnimalName'] > 800 返回一个布尔序列,表示Count_AnimalName列中每个元素是否大于800
# df['Count_AnimalName'] < 1000 返回一个布尔序列,表示Count_AnimalName列中每个元素是否小于1000
# 将这两个布尔序列进行逻辑与运算,得到一个布尔序列,表示Count_AnimalName列中每个元素是否同时满足大于800且小于1000的条件
# 最后,将这个布尔序列传递给df[],只选择满足条件的行
print(df[(df['Count_AnimalName'] > 800) & (df['Count_AnimalName'] < 1000)])
这段代码首先读取了一个名为dogNames2.csv的CSV文件,并将其转换为一个pandas的DataFrame对象。然后,它筛选出Count_AnimalName列中值大于800且小于1000的所有行,并打印这些行。
二.下面这段代码首先导入了pandas库,并使用它来读取一个CSV文件。然后,它对DataFrame进行排序,并打印出排序后的前5行。接着,它演示了如何使用pandas取行或列,以及注意事项。
# coding=utf-8
import pandas as pd
# 读取CSV文件,假设文件名为'dogNames2.csv',文件路径为当前目录
df = pd.read_csv('./dogNames2.csv')
# 打印出DataFrame的前5行
# print(df.head())
# 打印出DataFrame的信息,包括索引、数据类型、内存使用等
# print(df.info())
# 按照'Count_AnimalName'列的值进行降序排序
df = df.sort_values(by='Count_AnimalName', ascending=False)
# 打印排序后DataFrame的前5行
# print(df.head(5))
# pandas取行或列的注意点
# 1. 方括号写数组,表示取行,对行进行操作
# 2. 写字符串,表示取列索引,对列进行操作
# 取DataFrame的前20行
print(df[:20])
# 取'Row_Labels'列
print(df['Row_Labels'])
# 打印'Row_Labels'列的数据类型
print(type(df['Row_Labels']))
在这段代码中,我们首先读取了一个CSV文件并创建了一个DataFrame。然后,我们按照Count_AnimalName列的值对DataFrame进行了降序排序。接下来,我们使用方括号[]来取行和列。如果在方括号中写入一个整数或整数数组,我们将取行;如果写入一个字符串,我们将取列。最后,我们打印了前20行,Row_Labels列,并打印了Row_Labels列的数据类型,它是一个pandas的Series对象。
下面为代码涉及到的csv文件
https://wwt.lanzoum.com/inxjH1o61c0f
1145

被折叠的 条评论
为什么被折叠?



