- 博客(3)
- 收藏
- 关注
原创 数据异常排查
1.目前数据本身有问题 2.业务本身有问题 数据异常排查的前期准备: 业务理解 指标口径 当前数据产出过程 异常排查步骤: 判断是否异常 最大概率法则归类 闭环 第一步判断是否异常,有4个关键点: 亲自去看数据准确性,不要人云亦云 时间轴拉长,看是近期异常(3个月)还是历史异常 看和该指标关联的其他指标或其他核心指标是否也异常 找到一个关键人物(产品/数据),提前沟通 第二部就是最大概率法则归类 假期效应:开学季、暑假、四大节、当地节日 热点事件:常规热点(世
2020-09-28 19:01:36
543
原创 笔记整理1
# unique()返回的是值为布尔型的数组,nunique()返回的是唯一值的数量的多少 dataframe.nunique() # 保留2017.11.25-2017.12.3期间的数据 startTime = datetime.datetime.strptime("2017-11-25 00:00:00","%Y-%m-%d %H:%M:%S") endTime = datetime.datetime.strptime("2017-12-03 23:59:59","%Y-%m-%d %H:%M:%S
2020-09-13 22:31:00
112
原创 信用卡欺诈检测详细整理
import pandas as pd import matplotlib.pyplot as plt import numpy as np %matplotlib inline data = pd.read_csv("creditcard.csv") data.head() count_classes = pd.value_counts(data['Class'], sort = True).sort_index() count_classes.plot(kind = 'bar') plt.ti
2020-09-12 21:24:32
914
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人