数据处理与可视化综合指南
1. 矢量化字符串方法
在数据处理中,经常需要对字符串进行各种操作。以下是一些常见的矢量化字符串方法及其描述:
| 方法 | 描述 |
| — | — |
| cat | 按元素连接字符串,可选择分隔符 |
| contains | 如果每个字符串包含模式/正则表达式,则返回布尔数组 |
| count | 计算模式出现的次数 |
| endswith, startswith | 相当于对每个元素执行 x.endswith(pattern) 或 x.startswith(pattern) |
| findall | 计算每个字符串中模式/正则表达式的所有出现列表 |
| get | 对每个元素进行索引(检索第 i 个元素) |
| join | 使用传递的分隔符连接 Series 中每个元素的字符串 |
| len | 计算每个字符串的长度 |
| lower, upper | 转换大小写;相当于对每个元素执行 x.lower() 或 x.upper() |
| match | 对每个元素使用传递的正则表达式进行 re.match,将匹配的组作为列表返回 |
| pad | 在字符串的左侧、右侧或两侧添加空格 |
| center | 相当于 pad(side=’both’) |
| repeat | 重复值;例如 s.str.repeat(3) 相当于对每个字符串执行 x * 3 |
| replace | 用其他字符串替换模式/正则表达式的出现 |
| slice | 对 Series 中的每个字符串进行切片 |
数据处理与可视化实用指南
超级会员免费看
订阅专栏 解锁全文
1126

被折叠的 条评论
为什么被折叠?



