数据子集选择全攻略
在数据处理与分析中,从数据集中选择子集是一项基础且关键的操作。下面将详细介绍如何使用不同的索引器来选择数据子集。
1. 使用 .loc 索引器选择数据
.loc 索引器仅通过索引标签来选择数据。
- 选择单个值 :传递单个字符串会返回一个标量值。
city.loc['Heritage Christian University']
- 选择多个不连续标签 :使用列表来选择多个不连续的标签。
import numpy as np
np.random.seed(1)
labels = list(np.random.choice(city.index, 4))
city.loc[labels]
- 选择等间隔的数据分区 :使用切片表示法,确保起始和结束值为字符串,还可以使用整数指定切片的步长。
city.loc['Alabama State University':'Reid State Technical College':10]
2. 选择 DataFrame 行
使用
超级会员免费看
订阅专栏 解锁全文
44

被折叠的 条评论
为什么被折叠?



