Python数据分析NumPy和pandas(二十二、数据清洗和预处理之四:字符串操作)

Python 长期以来一直是一种流行的原始数据操作语言,部分原因是它易于对字符串和文本处理。大多数文本操作都使用 string 对象的内置方法,从而变得简单。对于更复杂的模式匹配和文本操作,可能需要正则表达式。pandas 使我们能够将字符串和正则表达式简洁的应用于整个数据数组,从而进一步帮我们解决了缺失数据的烦恼。

一.Python 内置字符串对象方法

用一组代码示例简单学习下Python内置字符串方法的使用。

import numpy as np
import pandas as pd

val = "a,b, guido"
# 按逗号切片字符串val
# 输出['a', 'b', ' guido']
val.split(",") 

# 先按逗号切片val,然后列表用推导式遍历每个切分出来的字符,并使用strip()方法去除前后空格
# 输出['a', 'b', 'guido']
pieces = [x.strip() for x in val.split(",")]

# 将pieces列表的三个值分别赋值给三个变量
first, s
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

FreedomLeo1

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值