西格玛准则剔除异常数据python代码

用西格玛准则剔除异常数据
我是两个数据差用的2西格玛
import pandas as pd
import numpy as np

def two_sigma_rule(data):
mean = np.mean(data)
std_dev = np.std(data)
lower_bound = mean - 2 * std_dev
upper_bound = mean + 2 * std_dev
return lower_bound, upper_bound

def remove_outliers(data1, data2):
# 对应列相减
residuals = data1 - data2
# 计算每一列的均值和标准差
column_means = np.mean(residuals, axis=0)
column_std_devs = np.std(residuals, axis=0)
# 计算每一列的标准化残差

standardized_residuals = (residuals - column_means) / column_std_devs
# 对于每一列,计算异常值的上下界
lower_bound, upper_bound = two_sigma_rule(standardized_residuals)

# 将异常值所在位置设为 NaN
outliers_indices = np.where((standardized_residuals < lower_bound) | (standardized_residuals > upper_bound))
outliers_rows, outliers_cols = outliers_indices
# 将异常值位置的值赋为 NaN
# 将异常值位置的值赋为 NaN
for row, col in zip(outliers_ro
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值