大数据分类与安全的集成方法
1. 引言
在当今数字化时代,技术的进步和创新应用使得每天都会从不同来源产生海量数据,这些数据被称为大数据。大数据不仅体量大,还具有非结构化、异构的特点,包含视频、非结构化文本、数值数据、音频等多种信息。处理如此大量的数据十分复杂,可能会遗漏重要信息。
为了更有效地处理大数据,聚类和分类等数据处理方法应运而生。目前已经有许多聚类和分类模型,但提高分类准确率以实现更好的性能是研究的主要目标。同时,大数据安全与分类过程同样重要,加密程序可以增强数据安全性,使分类后的数据能安全存储在云环境中。
本文提出了一种基于随机森林算法的大数据分类方法,并使用 DSS 加密技术将分类结果安全存储在云端,以实现最大的准确性和安全性。分类特征通过鲸鱼优化算法获取,该算法能选择最优特征,提高分类准确率。该模型在准确率、精度、召回率和 F1 分数等方面表现出色,且 DSS 加密在吞吐量、加密和解密时间方面优于现有的加密文件系统标准算法(EFSSA)。
主要贡献如下
- 提出了一种使用鲸鱼优化算法和随机森林分类器的大数据分类最优特征选择方法。
- 提出了一种简单有效的加密方法,在将大数据迁移到云环境之前对其进行保护。
- 对该模型与其他机器学习算法进行了深入的实验对比分析。
2. 相关工作
2.1 医疗领域大数据分类
- 径向基函数神经网络模型 :用于医疗大数据分类,结合了流形分析和最近邻传播算法。先通过流形算法处理数据,再用指数函数调整相似度指数,最后进行聚
超级会员免费看
订阅专栏 解锁全文
1390

被折叠的 条评论
为什么被折叠?



