数据处理与字符串操作全解析
数据替换与索引重命名
数据替换
在数据处理中,-999 可能是缺失数据的哨兵值。为了将这些值替换为 pandas 能识别的 NA 值,可以使用 replace 方法。以下是具体操作:
import numpy as np
import pandas as pd
# 假设 data 是一个 Series
data = pd.Series([1, -999, 2, -999, -1000, 3])
# 替换单个值
new_data = data.replace(-999, np.nan)
print(new_data)
如果要一次性替换多个值,可以传入一个列表和替换值:
# 替换多个值
new_data = data.replace([-999, -1000], np.nan)
print(new_data)
若为每个值使用不同的替换值,则传入一个替换值列表:
# 为每个值使用不同的替换值
new_data = data.replace([-999, -1000], [np.nan, 0])
print(new_data)
也可以传入一个字典:
# 传入字典进行替换
new_data = data.replace({
超级会员免费看
订阅专栏 解锁全文


被折叠的 条评论
为什么被折叠?



