how to clean data using Python (string part)

本文介绍了Python中字符串处理的实用技巧,包括替换子串、转换大小写、去除特殊字符及字符串分割等,适合初学者掌握基本的字符串操作方法。

1. substring

  1. str.replace() : find and replace
fav_color = "red is my favorite color"
fav_color = fav_color.replace("red", "blue")
print(fav_color)

输出:

blue is my favorite color

在这里插入图片描述所有的都会被替换
2. str.title():returns a copy of the string with the first letter of each word transformed to uppercase 在这里插入图片描述
3. 用函数去掉字符串中不需要的符号

test_data = ["1912", "1929", "1913-1923",
             "(1951)", "1994", "1934",
             "c. 1915", "1995", "c. 1912",
             "(1988)", "2002", "1957-1959",
             "c. 1955.", "c. 1970's", 
             "C. 1990-1999"]

bad_chars = ["(",")","c","C",".","s","'", " "]#需要删除的字符
bad_chars = ["(",")","c","C",".","s","'", " "]
def strip_characters(string):
    for char in bad_chars:
        string = string.replace(char,"")
    return string

stripped_test_data = []
for d in test_data:
    date = strip_characters(d)
    stripped_test_data.append(date)
  1. str.split(): split a CSV from one single string into a list of strings and then into a lists of lists. 在这里插入图片描述

  2. 在这里插入图片描述

  3. str.format(): inserting values into strings.普通输出→→→ 之后并且convert string from integer. 或者用key arguments在这里插入图片描述much better

  4. str.startswith()检查开头字符是否为我们要找的
    在这里插入图片描述

  5. 在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值