今儿,老Amy 在用 python 进行数据处理的时候,发现数据中含有\N
这种字符,伪数据如下:
于是,我就思考这到底是什么类型的数据呢?所以通过df.info()
方法进行查看,结果如下:
很显然,info
这个字段的类型为object
。所以我就寻思着,获取该列中的元素,将该列中的\N
替换为0
或者NA
。
我通过Series.str.replace
这个方法来实现该需求,代码如下:
df["info"].str.replace("\N","0")
意想不到的是,该代码报错了,报错结果如下:
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 0-1: malformed \N character escape
所以进一步思考,\N
实际上是有特殊含义的字符。所以,现在替换是否要进行转译?于是&#x