一、替换函数replace
基本结构:df.replace(new_value,value)
-
全局替换(注,默认inplace为false,不替换原数据框):
data.replace(1, ‘R’, inplace=True)
-
单列替换,比如需将数据的文本标签替换为数值,以进一步作分析:
In : data['y'].unique()
Out: array(['R', 'M'], dtype=object)
# 替换文本特征
data['y'].replace(1, 'R', inplace=True)
data['y'].replace(0, 'M', inplace=True)
- 替换指定的某个或多个数值
# 字典形式,其中键为原值,值为新值
data.replace({'A':'B', 29:100})
# 列表形式
data.replace(['A','29.54'], ['B',100])
# 替换的值相同
data.replace(['A','29.54'], 'B')
二、 更改数据类型
创建时直接通过dtype参数指定:
df = pd.DataFrame(a, dtype='float')
df = pd.DataFrame(data=d,