大数据证据识别与数据收集全解析
1. 数据可行性评估
数据可行性评估具有多方面的重要意义:
- 帮助调查人员识别潜在相关的数据来源。
- 提供可佐证访谈和文档审查信息的内容。
- 凸显数据的局限性或缺口。
- 为调查人员制定更优的数据收集计划提供信息。
在调查前期,调查人员仅收集了关于数据的相关信息。通过预览和评估数据样本,调查人员能够切实了解数据中包含的信息,并确定哪些数据源能够满足调查需求。
在大数据法医调查中,评估数据的可行性和相关性与传统数字法医调查有所不同。在传统调查中,由于担心改变数据或元数据,通常不会预览数据。而在大数据环境下,当元数据不相关或不可用时,数据可以进行预览,这为法医调查人员在确定收集哪些数据时提供了预览数据的机会。
预览数据有以下几种方法:
- 审查数据提取或查询结果 :审查数据提取物、查询结果,或收集存储在Hadoop中的样本文本文件。此方法可让调查人员确定可用信息的类型以及信息在数据中的呈现方式。但在由数千个数据源组成的高度复杂系统中,这种方法可能不可行,或者需要投入大量的时间和精力。
- 审查报告或预定义查询输出 :审查从数据中得出的报告或预定义查询输出。一些大数据解决方案配备了与大数据系统相连的报告应用程序,这些报告是强大的工具,使调查人员无需花费太多前期精力访问系统,就能快速了解系统内容。
同时,在这一步骤中还应审查和考虑数据保留政策和数据清除计划。由于涉及大量数据,许多组织会定期在一段时间后清除数据。数据清除可能意味着将数据存档到近线或离线存储,也可能意味着在没有备份的情况下
超级会员免费看
订阅专栏 解锁全文

471

被折叠的 条评论
为什么被折叠?



