Python数据清洗——字符串操作

博客介绍了常用的数据清洗方法,包括字符串操作、正则表达式和第三方库。着重阐述了数据清洗中字符串操作的截取、替换、查找和分割,还指出字符串操作可解析HTML,但纯字符串解析代码冗长,一般用于有特征的个别数据清洗。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

常用的数据清洗方法有:字符串操作、正则表达式第三方库

常用数据清洗的字符串操作有截取、替换、查找分割

  • 截取:str[开始位置 : 结束位置 : 间隔位置]    #默认开始位置为0#
  • 替换:str.replace('被替换的内容','替换后的内容')   #replace()方法替换字符串后仅为临时变量,需重新赋值才能保存#
  • 查找:str.find('要查找的内容',[开始位置,结束位置])  #默认从0开始,返回目标第一个内容的位置,若未查找到,则返回-1#
  • 分割:str.split(‘分割符’,分割次数)   #分割后,返回一个列表类型数据#

注:字符串操作可以解析HTML,但纯字符串解析HTML会导致代码冗长,不便维护。字符串操作一般用于个别数据清洗,且数据具有一定的特征。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值