数据系列操作:条件更新、字符串评估与清理
1. 数据系列值的条件更新
在数据处理中,我们常常需要根据特定条件来更新数据系列的值。下面将介绍几种常用的方法。
1.1 使用 loc 和 iloc 访问器更新值
为了避免出现 SettingwithCopyWarning 警告,我们可以使用 DataFrame 的 loc 和 iloc 访问器来选择特定的值进行更新。例如:
import pandas as pd
nls97 = pd.read_csv("data/nls97f.csv", low_memory=False)
nls97.set_index("personid", inplace=True)
# 这种方式会触发警告
# nls97.gpaoverall.loc[[135335]] = 3
# 这种方式不会触发警告
nls97.loc[[135335], 'gpaoverall'] = 3
1.2 使用NumPy的 where 和 select 方法
我们可以使用NumPy的 where 和 select 方法根据系列的值、其他系列的值以及汇总统计信息来分配系列值。以下是具体的操作步骤:
1. 导入必
超级会员免费看
订阅专栏 解锁全文
6万+

被折叠的 条评论
为什么被折叠?



