pandas---拉伊达准则、箱线图

该代码示例展示了如何利用numpy计算平均值和标准差,通过三倍标准差规则检测数据中的异常值。在主文件main.py中,定义了函数three_sigma来找出超过平均值3个标准差的数值。在test.py中,读取房屋销售数据并应用异常检测,然后用pandas和matplotlib对菜谱价格进行箱型图展示,进行异常值可视化分析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

main.py
import numpy as np
def three_sigma(ser1):
# 平均值
mean_value = ser1.mean()
# 标准差
std_value = ser1.std()
rule = (mean_value - 3*std_value > ser1) | (mean_value + 3*std_value < ser1)
index = np.arange(ser1.shape[0])[rule]
outrange = ser1.iloc[index]
return outrange

test.py
import pandas as pd
import matplotlib.pyplot as plt
import main

file = open("E:/某地区房屋销售数据.csv")
df = pd.read_csv(file)
print(df)
print(main.three_sigma(df["房屋价格"]))

data = {"菜谱": ["红烧肉", "铁板鱿鱼", "小炒肉", "干锅鸭掌", "酸菜鱼"],
"价格": [39, 30, 26, 388, 35]}
df = pd.DataFrame(data)
print(df)
plt.rcParams['font.sans-serif'] = ['Simsun']
df.plot.box(title="菜谱异常值", vert=False)
plt.grid(linestyle="--", alpha=0.3)
plt.show()


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值