数据子集选择全攻略
在数据处理和分析中,选择数据子集是一项基础且关键的操作。本文将详细介绍如何使用不同的方法和索引器来选择数据子集,包括 Series 和 DataFrame 的行、列选择,以及如何同时选择行和列,还会涉及一些提高选择效率的技巧。
1. 使用 .loc 索引器选择数据
.loc 索引器仅通过索引标签来选择数据。以下是几种常见的使用方式:
- 选择单个值 :传递单个字符串会返回一个标量值。
>>> city.loc['Heritage Christian University']
Florence
- 选择多个不连续的标签 :使用列表来选择多个不连续的标签。
>>> np.random.seed(1)
>>> labels = list(np.random.choice(city.index, 4))
>>> labels
['Northwest HVAC/R Training Center',
'California State University-Dominguez Hills',
'Lower Columbia College',
'Southwest Acupuncture College-Boulder']
>>> city.loc[labels]
INSTNM
North
超级会员免费看
订阅专栏 解锁全文
83

被折叠的 条评论
为什么被折叠?



