数据驱动的安全分析与可视化实践
1. 数据处理与多维缩放分析
在处理行业数据时,首先要对数据进行整理和转换。以下是具体的操作步骤:
1. 数据折叠与清理 :
imat <- foldmatrix(vmat, industry, min=10, clean=T)
dim(imat)
## [1] 17 251
这里有17个行业(实际上是来自NAICS规范的17个独特的两位数行业代码),函数在折叠矩阵后清理了13列。现在每行代表一个行业,列代表VERIS变量,值代表该行业中存在VERIS变量的事件比例。
2. 多维缩放分析 :
- 转换为距离矩阵 :
idist <- dist(imat, method='canberra')
使用Canberra距离度量计算每对行业之间的距离。
- 进行经典多维缩放 :
cmd <- cmdscale(idist)
head(cmd)
## [,1] [,2]
## victim.industry2.32 -75.080869 -50.662403
## victim.industry2.33 -29.457487 -2.942
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



