数据子集选择与布尔索引的深入解析
1. 数据子集选择
在数据处理中,选择数据子集是一项常见操作。当使用 .loc 进行数据选择时,通常是基于传递给它的精确标签来进行的。若索引中未找到这些标签,会引发 KeyError 。不过,当索引按字典顺序排序且传递切片时,会有特殊情况。此时,即使切片的起始和结束标签并非索引的精确值,也能在它们之间进行选择。
例如,若要选择名称以字母 Sp 到 Su 开头的学院,可使用以下代码:
college.loc['Sp':'Su']
同样,若要选择名称以字母 D 到 S 开头的所有学院,可使用:
college.loc['D':'T']
这种切片方式包含最后一个索引,所以理论上会返回名称恰好为 T 的学院。
此外,当索引按相反方向排序时,这种切片方式同样适用。可通过 is_monotonic_increasing 或 is_monotonic_decreasing 属性来确定索引的排序方向。例如,以下代码将索引按从 Z 到 A 的字典顺序排序:
超级会员免费看
订阅专栏 解锁全文
1804

被折叠的 条评论
为什么被折叠?



