【pandas警告】SettingwithCopyWarning出现的原因和解决方案

问题

操作 DataFrame 的时候有时会报SettingwithCopyWarning的警告,如下图:
在这里插入图片描述
然后吧,你按着他的提示,尝试改用.loc,结果还是没卵用。最后由于懒得检查,索性直接关闭所有警告信息:

import warnings
warnings.filterwarnings("ignore")

警告虽不是错误,但直接关闭警告肯定是不对。警告的作用就是告诉你虽然代码语法正确,但也会出现潜在的错误或问题。

原因

导致这条告警产生的原因,是由于pandas无法判断对原始DataFrame进行切片,产生的是视图还是副本。如果切片产生的是视图,则赋值操作会修改原始DataFrame,如果产生的是副本,则不会修改原始的DataFrame。
看下面代码演示:

df = pd.DataFrame(np.arange(4*5).reshape(4, 5))
df  # 这是原始的DataFrame

在这里插入图片描述
下面的操作就会报错:

# 这是一个切片视图
view_df = df.iloc[:,3:4]
# 对视图修改时就会报错
view_df.iloc[2:3,:]=0

在这里插入图片描述

解决方案

下面操作就是正确的:

# 这是一个切片副本
copy_df = df.iloc[:,3:4].copy()  # copy一个副本
# 对副本修改时就不会报错
copy_df.iloc[2:3,:]=0
### 解决Pandas中的KeyError: 1186 在Pandas中,当尝试访问不存在的列或标签时会抛出 `KeyError` 异常。对于特定错误 `KeyError: 1186`,其根本原因是试图通过 `.loc[]`, `.iloc[]` 或者直接索引来查找一个并不存在于 DataFrame 中的键或位置。 #### 原因分析 以下是可能导致此问题的原因列表: - **列名拼写错误**:如果输入的列名存在大小写差异或者有额外字符,则无法匹配到实际存在的列名[^1]。 - **数据加载不完整**:有时文件未被正确读入内存,导致部分列缺失[^2]。 - **索引越界**:如果是基于整数的位置索引 (`.iloc`) 而非名称索引 (`.loc`) ,则可能是请求了一个超出范围的数据行号或列编号[^4]。 #### 处理方案 为了有效应对上述情况下的 KeyError, 可采取如下措施: 1. **验证目标是否存在** 在操作之前先确认所需字段确实存在于当前对象之中: ```python if 'target_column' in df.columns: result = df['target_column'] else: print('Column does not exist') ``` 2. **检查数据结构** 打印整个 dataframe 的头部信息以及全部列的名字来确保了解确切的内容布局 ```python print(df.head()) print(list(df.columns)) ``` 3. **异常捕获机制** 利用 try-except 结构可以优雅地处理这些潜在失败情形而不中断程序执行流程. ```python try: value = df.loc[row_index,'column_name'] except KeyError as e: logging.error(f"Encountered a key error while accessing {e}") ``` 关于更深层次的最佳实践方面,可参考以下几点建议以减少未来发生类似状况的可能性: - 定期进行单元测试覆盖主要业务逻辑路径; - 添加详尽文档说明各函数接口参数含义及其预期行为模式; - 积极参与团队内部代码评审过程发现隐藏缺陷提前修正; 另外值得注意的是,在某些复杂场景下还可能会遭遇另一个常见警告——SettingWithCopyWarning。这主要是由于不确定某个子集选取动作到底是创建了一份独立拷贝还是仅仅获得原始表的一个视图所致[^3]。尽管它本身不会阻止脚本继续运行下去,但是如果不小心修改了意外关联上的另一份资料的话就容易引发难以追踪的结果偏差现象因此也需要引起足够的重视加以防范。 ```python import pandas as pd df = pd.DataFrame({ 'A': ['foo', 'bar'], 'B': [1, 2], }) # 正确方式更新值前应明确判断是否为副本 if isinstance(df.query("A == 'foo'"), pd.core.frame.DataFrame): df.loc[df.A=='foo','B'] *= 10 else: raise ValueError("Operation would create an ambiguous copy.") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值