- 博客(3)
- 收藏
- 关注
原创 Python:异常值检测箱型图(附:正态分布3σ)
异常值检测的方法有很多,通过数据分布图型寻找异常值、算法模型(聚类、随机森林等),我这里就是记录一下工作中做初步的数据探查时用到的箱型图检测和正态分布检测,这两种都是根据数据分布情况来识别异常值的,没有结合到业务的层面,在做初步的探查时还是高效且适用的。因为正态分布3σ的异常值检测需要数据符合正态分布,现实情况中大部分数据都是杂乱无章的,因此重点使用的是箱型图检测。1.箱型图的优势(1)准确稳定地描绘出数据的离散分布情况且不需要服从特定的分布形式箱形图的绘制依靠实际数据,不需要事...
2022-05-04 21:51:15
6167
2
原创 Python:excel读写
1.读Excel的sheet名imprt xlrddef get_sheetnames(filename): workbook = xlrd.open_workbook(filename) # 打开工作簿 sheets = workbook.sheet_names() return sheets2.删除默认sheet页,例如:Sheet1,Sheet2等等啊def remove_worksheet(sheetnames): n = len(sheet
2022-04-29 17:56:46
827
原创 Python:xlsxwriter
typeError: NAN/INF not supported in write_number() without 'nan_inf_to_errors'原因:在计算投资额/项目数时,项目数为0时,产生dataframe里有nan的值存在。解决方法:(1)创建workbook时,参数中配置,允许nan的存在xlsxwriter.Workbook(filename, {'nan_inf_to_errors': True})(2)按单元格遍历写入时,处理抛出的异常try:
2022-04-29 16:06:56
2246
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人