Pandas数据处理与时间序列分析全解析
1. 数据筛选与添加
1.1 数据筛选
在处理数据时,我们常常需要根据特定条件筛选出符合要求的数据。例如,我们有一个包含年龄和籍贯信息的数据集:
import pandas as pd
my_DF = pd.DataFrame({'age': [15, 17, 21, 29, 25],
'state_of_origin': ['Lagos', 'Cross River', 'Kano', 'Abia', 'Benue']})
print(my_DF)
若要删除年龄小于 20 的行,可以使用以下代码:
my_DF.drop(my_DF[my_DF['age'] < 20].index, inplace=True)
print(my_DF)
1.2 数据添加
1.2.1 添加列
我们可以使用 assign 方法向 Pandas 数据框中添加新列。例如,添加每个州的首府信息:
my_DF = pd.DataFrame({'age': [15, 17, 21, 29, 25],
'state_of_origin': ['Lagos', 'Cross River', 'Ka
超级会员免费看
订阅专栏 解锁全文
1502

被折叠的 条评论
为什么被折叠?



