数据驱动的安全分析与可视化:从机器学习到安全仪表盘设计
一、数据预处理与多维缩放分析
在进行行业数据的分析时,我们首先需要对数据进行预处理。以下是具体的操作步骤:
# 折叠矩阵
imat <- foldmatrix(vmat, industry, min=10, clean=T)
# 查看矩阵维度
dim(imat)
## [1] 17 251
这里有 17 个行业(实际上是来自 NAICS 规范的 17 个独特的两位数行业代码)。折叠矩阵后,函数清理了 13 列。现在每行代表一个行业,列代表 VERIS 变量,值代表该行业中存在 VERIS 变量的事件比例。
接下来,我们对这些行业数据进行多维缩放分析,步骤如下:
# 将矩阵转换为距离矩阵
idist <- dist(imat, method='canberra')
# 进行经典多维缩放
cmd <- cmdscale(idist)
# 查看返回结果的前几行
head(cmd)
## [,1] [,2]
## victim.industry2.32 -75.080869 -50.662403
## victim.industry2.33 -29.457487 -2.942502
## victim.industry2.42 -24.727909 21.751872
## victim.industry2.44 3.692422 7.840992
## victim.indus
数据驱动的安全可视化分析
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



