Pandas数据处理与统计分析实用指南
1. 避免链式索引赋值
在进行数据赋值操作时,应避免使用链式索引,因为这可能会导致意外的结果或触发 SettingWithCopyWarning 警告。建议使用单个 loc 操作来重写链式赋值。
示例代码 :
import pandas as pd
data = pd.DataFrame({
'one': [1, 3, 5, 3],
'two': [0, 3, 5, 3],
'three': [0, 3, 5, 3],
'four': [0, 3, 5, 3]
}, index=['Ohio', 'Colorado', 'Utah', 'New York'])
# 错误做法
# data[data.three == 5]['three'] = 6
# 正确做法
data.loc[data.three == 5, "three"] = 6
print(data)
2. 算术运算与数据对齐
Pandas 在处理不同索引的对象时,会自动进行数据对齐。当进行加法等算术运算时,如果索引对不相同,结果中的相应索引将是索引对的并集。
Series 示例 :
import pandas as pd
s1 = pd.Series([7.3, -2.5, 3.4,
超级会员免费看
订阅专栏 解锁全文
2183

被折叠的 条评论
为什么被折叠?



