数据处理中的布尔索引与索引对齐
布尔索引
布尔索引是数据处理中强大的工具,它允许我们根据特定条件筛选数据。
限制数据范围
在处理数据时,我们可能会遇到数据范围过大或存在异常值的情况。可以使用 where 方法来限制数据范围。
# 假设已经有一个名为fb_likes的Series
fb_likes_cap = fb_likes.where(fb_likes <= 20000, 20000).where(fb_likes >= 300, 300)
fb_likes_cap.hist()
这里, where 方法会保留布尔条件为 True 的原始值,将条件为 False 的值替换为指定的值。同时,Pandas还提供了内置的 clip 方法来实现相同的功能:
fb_likes_cap2 = fb_likes.clip(lower=300, upper=20000)
print(fb_likes_cap2.equals(fb_likes_cap)) # 输出True
屏蔽DataFrame行
mask 方法与 where 方法相反,它会在布尔条件为 True 的地方创建缺失值。
超级会员免费看
订阅专栏 解锁全文
783

被折叠的 条评论
为什么被折叠?



