Pandas数据处理实战:从基础操作到异常值处理
一、字符串匹配与拆分
1.1 衬衫数据示例
假设有衬衫数据,包括衬衫类型和尺寸信息。以下是部分数据展示:
4 shirt xlarge
5 shirt large
6 shirt medium
7 shirt small
8 shirt small
9 shirt xsmall
10 shirt xsmall
11 shirt xsmall
1.2 代码实现
通过 shirts_str.py 文件可以实现对衬衫数据的字符串匹配与拆分操作,代码如下:
import pandas as pd
shirts = pd.read_csv("shirts.csv")
print("shirts:")
print(shirts)
print()
print("shirts starting with xl:")
print(shirts[shirts.ssize.str.startswith('xl')])
print()
print("Exclude 'xlarge' shirts:")
print(shirts[shirts['ssize'] != 'xlarge'])
print()
print("first three letters:")
shirts['sub1'] = shirts['ssize'].str[:3]
Pandas数据处理:实战技巧与异常值分析
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



