问题:我们系统是采集数据,然后有一些特定规则去将数据采集入库,现在总共进来100条数据,但只有10条符合规则,怎么去判定确实是只有10条符合规则而不是12条漏掉了2条符合规则的数据?
回答:
数据抽样检查:从原始数据中随机抽取一部分数据进行人工或自动验证,确保它们是否符合规则。
日志分析:分析系统日志,查看数据处理过程中的详细信息,包括哪些数据被处理、哪些数据被拒绝等。通过分析日志可以发现是否有数据被漏掉或者被错误处理。
数据审计:在数据处理过程中添加审计功能,记录每条数据的处理情况,包括是否符合规则、被拒绝的原因等。通过审计日志可以追踪数据处理过程,确保所有数据都被正确处理。
数据重复性检查:检查数据处理过程是否具有数据重复性,即同样的数据是否每次都能得到相同的处理结果。如果有数据处理结果不一致的情况,可能是有数据被漏掉或者错误处理。
对比不同系统的数据处理结果:如果有多个系统对同样的数据进行处理,可以对比它们的处理结果,确保结果一致性。如果有系统处理结果不一致的情况,可能是有数据被漏掉或者错误处理。
文章讨论了如何在数据采集后确保只有10条数据符合特定规则,提出通过数据抽样检查、日志分析、数据审计以及对比不同系统处理结果来检测可能的遗漏或错误。
1760

被折叠的 条评论
为什么被折叠?



