- 博客(3)
- 收藏
- 关注
原创 数据异常排查
1.目前数据本身有问题2.业务本身有问题数据异常排查的前期准备:业务理解指标口径当前数据产出过程异常排查步骤:判断是否异常最大概率法则归类闭环第一步判断是否异常,有4个关键点:亲自去看数据准确性,不要人云亦云时间轴拉长,看是近期异常(3个月)还是历史异常看和该指标关联的其他指标或其他核心指标是否也异常找到一个关键人物(产品/数据),提前沟通第二部就是最大概率法则归类假期效应:开学季、暑假、四大节、当地节日热点事件:常规热点(世
2020-09-28 19:01:36
634
原创 笔记整理1
# unique()返回的是值为布尔型的数组,nunique()返回的是唯一值的数量的多少dataframe.nunique()# 保留2017.11.25-2017.12.3期间的数据startTime = datetime.datetime.strptime("2017-11-25 00:00:00","%Y-%m-%d %H:%M:%S")endTime = datetime.datetime.strptime("2017-12-03 23:59:59","%Y-%m-%d %H:%M:%S
2020-09-13 22:31:00
156
原创 信用卡欺诈检测详细整理
import pandas as pdimport matplotlib.pyplot as pltimport numpy as np%matplotlib inlinedata = pd.read_csv("creditcard.csv")data.head()count_classes = pd.value_counts(data['Class'], sort = True).sort_index()count_classes.plot(kind = 'bar')plt.ti
2020-09-12 21:24:32
968
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅