pandas字符串函数

《Python Data Analysis》

pandas中矢量化的字符串函数

问题: 通过Series的map函数,所有字符串和正则表达式方法都能被应用于各个值(传入lambda表达式或其他函数),但是如果存在NA就会报错。

解决: Series有一些能够跳过NA值得字符串操作方法,通过Series的str属性可以访问这些方法。

矢量化的字符串方法:

方法说明
cat实现元素级的字符串连接操作,可指定分隔符
contains返回表示各字符串时候含有指定模式的布尔型数组
count模式出现的次数
endswith、startswith对各个元素执行x.endswith(pattern)或x.startswith(pattern)
findall计算各字符串的模式列表
get获取各元素的第i个字符
join根据指定的分隔符将Series中的各个元素的字符串连接起来
len字符串长度
lower、upper大小写转换
match根据指定的正则表达式对各个元素执行re.match
pad在字符串的左边或右边或两边添加空白符
center相当于pad(side=’both’)
repeat重复值。例如s.str.repeat(3)相当于对各个字符串执行x * 3
replace用指定字符串替换找到的模式
slice对Series的各个字符串进行子串截取
split根据分隔符或正则表达式对字符串进行拆分
strip、rstrip、lstrip去除空白符
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值