Pandas数据处理与分析全攻略
1. 数据选择基础
在Pandas中,选择行和列是基础操作。若要将索引重置为从零开始的形式,可使用 df.reset_index(drop=True) ,其中 df 代表任意数据框结果。例如:
view.loc['b':'d', 'Name':'Ticket'].reset_index(drop=True)
这行代码选取了从行 b 到行 d ,列 Name 到列 Ticket 的数据,并重置了索引。
2. 数据过滤
过滤操作能让我们挑选出满足特定条件的行。例如,若要筛选出年龄超过一定最小值、已婚或状态属于某些特定类别的个体数据,过滤就非常有用。
过滤的核心原理是 df[boolean_list] ,这里的 boolean_list 是一个由 True 和 False 组成的列表,其长度与 df 的长度一致。如果 boolean_list 是一个Pandas Series,每个布尔值还会有对应的索引。若布尔值为 True ,则该行会被保留在结果数据框中;若为 False ,则该行会被排除。 </
超级会员免费看
订阅专栏 解锁全文
612

被折叠的 条评论
为什么被折叠?



