恐怖袭击分类与多功能物联网相机的深度学习应用
1. 恐怖袭击分类模型构建
1.1 数据输入与整合
使用橙色数据挖掘工具创建机器学习模型,首先将全球恐怖主义数据集和计算嵌入作为输入数据集,通过 CSV 文件导入块输入到橙色工具中。可以使用数据表块可视化 CSV 文件的内容,然后将数据表块的输出作为合并数据块的输入,将不同的数据集整合为一个数据集。
1.2 数据预处理
- 处理空值 :合并后的数据集中存在许多空值,不能直接作为模型的输入,因此使用插补块消除这些空值。橙色数据挖掘工具的插补块提供了多种算法选择,如平均和最频繁插补算法、随机值插补算法、基于模型的插补方法或固定值或数值插补算法。本研究使用最频繁和平均插补程序去除数据集中的空值。
- 去除冗余数据 :使用橙色工具中的清除域块消除数据集中的冗余特征。清除域块提供了三种消除冗余特征的选项:特征、类别和元属性,主要功能包括排序、减少和去除特征。
- 降维 :机器学习模型常面临因数据集特征过多导致的过拟合问题。本研究使用主成分分析(PCA)将维度降至两个分量,橙色数据挖掘工具中的 PCA 块以 99% 的方差进行降维。
- 数据缩放 :数据缩放是将数据带入特定范围,以便模型能够快速学习和分类的过程。橙色工具提供了多种缩放技术,如常规缩放和中心缩放,使用橙色数据处理器块进行数据缩放,该块还提供了离散化、连续化、插补、归一化、随机化和主成分分析等数据准备选项。
超级会员免费看
订阅专栏 解锁全文
1449

被折叠的 条评论
为什么被折叠?



