新型大数据日志分析框架的综合性能评估
1. 引言
在大数据时代,日志和流量数据具有格式多样、持续产生且数量庞大的特点。为了监测安全问题的早期迹象,防止未来发生更严重的安全灾难,采用大数据分析方法来收集和分析与关键 IT 基础设施相关的原始异构日志数据至关重要。
2. 相关研究
2.1 大数据分析:概念理解与计算范式整合的近期工作
如今,大数据分析方法和技术的研究日益流行,目的是从海量信息中获取价值。相关研究聚焦于大数据的概念、架构和典型计算系统,强调复合处理系统的必要性,以及批处理和流处理系统的概念描述与比较分析。有研究提出了一种统一的流处理和批处理计算架构,通过在 MapReduce 工作负载和流处理平台之间构建一层,融合了流处理的优势和 MapReduce 批处理的编码便利性。流分析是一个新兴研究领域,关注可扩展性、互操作性、高可用性、即时性、可变性和优化任务调度等重要问题。
2.2 大数据日志分析框架的比较评估
相关研究评估了物联网应用中流分析框架的优缺点,对比了 Spark 和 ELK Stack 这两个分析日志数据的重要框架,通过不同复杂度的问题解决方案实验,评估了它们在处理时间和资源使用等非功能特性方面的差异。同时,强调了开源平台在日志分析中的实用性,指出开源替代方案相对于高成本、复杂且资源需求大的专有安全日志分析解决方案的优势。由于大数据的特性,传统检测算法在识别欺诈事件方面存在困难,而大数据分析在威胁情报中的应用得到了体现。
3. 开源平台在大数据日志分析中的采用和成熟度调查
许多研究探讨了大数据分析的新兴趋势,以准确处理大数据。例如,通过 Spar