自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Python:异常值检测箱型图(附:正态分布3σ)

异常值检测的方法有很多,通过数据分布图型寻找异常值、算法模型(聚类、随机森林等),我这里就是记录一下工作中做初步的数据探查时用到的箱型图检测和正态分布检测,这两种都是根据数据分布情况来识别异常值的,没有结合到业务的层面,在做初步的探查时还是高效且适用的。因为正态分布3σ的异常值检测需要数据符合正态分布,现实情况中大部分数据都是杂乱无章的,因此重点使用的是箱型图检测。1.箱型图的优势(1)准确稳定地描绘出数据的离散分布情况且不需要服从特定的分布形式箱形图的绘制依靠实际数据,不需要事...

2022-05-04 21:51:15 6167 2

原创 Python:excel读写

1.读Excel的sheet名imprt xlrddef get_sheetnames(filename): workbook = xlrd.open_workbook(filename) # 打开工作簿 sheets = workbook.sheet_names() return sheets2.删除默认sheet页,例如:Sheet1,Sheet2等等啊def remove_worksheet(sheetnames): n = len(sheet

2022-04-29 17:56:46 827

原创 Python:xlsxwriter

typeError: NAN/INF not supported in write_number() without 'nan_inf_to_errors'原因:在计算投资额/项目数时,项目数为0时,产生dataframe里有nan的值存在。解决方法:(1)创建workbook时,参数中配置,允许nan的存在xlsxwriter.Workbook(filename, {'nan_inf_to_errors': True})(2)按单元格遍历写入时,处理抛出的异常try:

2022-04-29 16:06:56 2246 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除