电商数据真实性与企业可持续发展研究
电商销售数据欺诈检测方法框架
在销售数据欺诈检测方面,基于前人研究成果,制定了一套检测销售数据欺诈的方法框架。该框架依据Nigrini和Mittermaier总结的四个宽泛数据条件,以及Wallace提出的两个标准,制定了一系列初步标准,用于验证使用本福特定律检测销售数据的适用性。具体标准如下:
1. 样本量标准 :样本量应大于30。
2. 偏度标准 :样本数据的偏度应为正,可通过公式 (Skew(X) = E[(\frac{X - \mu}{\sigma})^3]) 计算,其中 (X) 是样本数据的随机变量,(E) 是期望值运算符,(\mu) 是样本均值,(\sigma) 是样本标准差。
3. 均值与中位数关系标准 :样本均值应高于中位数。
4. 数据量标准 :数据量无限制。
5. 自然生成标准 :数据自然生成,无人为因素影响。
6. 非自相关标准 :数据无自相关性。
检测流程如下:
graph LR
classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
classDef de
超级会员免费看
订阅专栏 解锁全文
3211

被折叠的 条评论
为什么被折叠?



