大数据隐私与物联网设备访问控制研究综述
大数据隐私保护
在大数据时代,数据的隐私保护至关重要。大数据分析工具如 Hadoop 和 Spark 能帮助数据科学家应对商业挑战,提供商业智能解决方案,包括仪表盘、报告、查询以及预测分析等。然而,数据科学家必须确保个人用户的隐私。
现有的数据类型包括结构化、半结构化、准结构化和非结构化数据,其中约 80% 是非结构化数据。因此,现有的算法需要重新设计,以处理非结构化的隐私保护数据。现有的基于密码学和随机化的算法是为较小的数据集设计的,所以需要新的隐私保护框架来处理分布在多个集群中的大量数据。
面临的挑战包括开发适用于大数据的高效可扩展算法、净化数据的实用性、数据记忆、数据来源、审计跟踪和隐私保证等。近期的技术框架如 Map Reduce、Spark 等有能力处理此类大数据。
物联网设备访问控制与认证
物联网(IoT)是信息技术领域的新兴现象,指的是联网设备的普遍存在,这些设备能够从现实世界收集信息并执行操作。随着第五代网络高速无线下载速度和云存储服务的日益普及,到 2020 年,物联网设备预计将达到 260 亿台。
物联网设备具有高集成性,广泛应用于医疗保健、智能家居和关键基础设施等领域。但这也使得它们成为网络攻击的目标,黑客组织可能会进行类似震网病毒的攻击,控制大量物理机制,收集大量数据或造成实际损害。
可靠的访问控制是防止此类攻击的重要支柱。访问控制包括认证(识别请求数据的来源是否真实)、授权(决定认证用户可访问的数据)和问责(记录授权用户的操作以便审查)。然而,物联网设备的特性使得可靠的访问控制面临重大挑战。这些设备需要实时处理大量数据流,要对大量异