数据处理与字符串操作全解析
1. 数据重命名
在数据处理中,重命名索引和列名是常见操作。使用 rename 方法可以避免手动复制DataFrame并为其索引和列属性分配新值的繁琐过程。示例代码如下:
import pandas as pd
data = pd.DataFrame({
'one': [0, 4, 8],
'two': [1, 5, 9],
'three': [2, 6, 10],
'four': [3, 7, 11]
}, index=['OHIO', 'COLO', 'NEW'])
data.rename(index={"OHIO": "INDIANA"},
columns={"three": "peekaboo"})
输出结果:
one two peekaboo four
INDIANA 0 1 2 3
COLO 4 5 6 7
NEW 8 9 10 11
2. 离散化与分箱
连续数据通常需要进行离散化或分箱处理,以便进行分析。下面以年龄数据为例,介绍如何使用 pandas.cut 进行分箱操作。
2.1 示例数据
ages =
数据处理与字符串操作详解
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



