Python 长期以来一直是一种流行的原始数据操作语言,部分原因是它易于对字符串和文本处理。大多数文本操作都使用 string 对象的内置方法,从而变得简单。对于更复杂的模式匹配和文本操作,可能需要正则表达式。pandas 使我们能够将字符串和正则表达式简洁的应用于整个数据数组,从而进一步帮我们解决了缺失数据的烦恼。
一.Python 内置字符串对象方法

用一组代码示例简单学习下Python内置字符串方法的使用。
import numpy as np
import pandas as pd
val = "a,b, guido"
# 按逗号切片字符串val
# 输出['a', 'b', ' guido']
val.split(",")
# 先按逗号切片val,然后列表用推导式遍历每个切分出来的字符,并使用strip()方法去除前后空格
# 输出['a', 'b', 'guido']
pieces = [x.strip() for x in val.split(",")]
# 将pieces列表的三个值分别赋值给三个变量
first, second, third = pieces
# 用分隔符"::"连接三个字符串
# 输出'a::b::guido'
first + "::" + second + "::" + third
# 调用join方法输出效果和上面的相同
# 输出'a:
订阅专栏 解锁全文
1356

被折叠的 条评论
为什么被折叠?



