大数据调查分析与结果呈现全解析
在大数据调查分析领域,涉及到众多关键环节和技术,从数据的初步分析到最终结果的呈现,每一步都至关重要。下面将详细介绍大数据调查分析的各个方面。
异常类型时间线分析
可以通过时间线绘制异常类型的相对百分比,以展示相对于每日记录总数的趋势。例如,在欺诈调查中,这种分析有助于确定欺诈事件发生的时间,并表明这些事件在特定时间段内并非正常现象。像2000年6月2日,异常率为2.84%,这是异常百分比最高的一天,但并非异常数量最多的一天。
不同数据集的分析
大数据调查往往涉及多个不同的数据集,如社交媒体数据和会计数据。这些数据集来源不同,可能难以自然地关联数据或轻松比较值。为解决此问题,调查人员可采取以下步骤:
1. 数据转换 :对两个数据集进行数据转换,识别某些值(如地址或名称)是否可以标准化。若数据集有相同类型的值,应采取步骤对其进行标准化。
2. 其他技术应用 :
- 识别重复和数据重叠 :可能需要采取后续纠正措施。
- 在一个或多个公共字段上关联数据 。
- 执行交易映射 :这是在没有自然链接的数据集之间创建链接的一组技术。例如在金融欺诈调查中,追踪股票订单到执行点,再从执行点追踪到账户投资组合。
交易映射的具体步骤如下:
1. 识别所有可能关联的字段 。
2. 测试可能的链接 :
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



