自动改善自治系统推理关系的方法与应用
1. 自动方法概述
为了重现参考数据集,我们提出了一种基于关键字匹配的聚类方法。该方法一般为每个池构建一个图,将池元素转换为节点(如自治系统编号 ASN、CA2O.org 或 PDB.org),为每个节点收集一组识别特征,并通过匹配关键字在相关节点之间建立边。
1.1 应用范围
我们仅考虑 PDB 和 CA2O 之间的不一致作为可能错误的指示,没有差异的池不在该方法的应用范围内。对于不包含多个 APNIC 分配的自治系统的 Class - 1 池,CA2O 映射较为准确,我们直接使用 CA2O 映射。因此,该方法应用于 507 个池和 4550 个 ASN,包括 Class - 2 和 Class - 3 的所有池,以及 Class - 1 中的候选 APNIC - LIR 池。
1.2 方法步骤
该方法包含五个阶段:
1. 构建图:节点为池中的 ASN、CA2O.org 和 PDB.org。
2. 数据准备:分三步提取每个节点的识别特征。
3. 图初始化:针对不同类别的池采用不同策略,包括预先填充边和添加新的组织节点。
4. 关键字匹配:比较每对节点,若关键字集有匹配则建立边。
5. 集群发现:使用广度优先搜索算法找出图中的连通分量作为集群。
2. 数据准备
数据准备包括数据收集、数据清理和特征提取三个步骤,完成后为图中的每个节点关联一组关键字。
2.1 数据收集
从 Whois 和 PDB 收集 6 种属性:ID、名称、别名、描述、管理员和网站,网站属性还
超级会员免费看
订阅专栏 解锁全文
543

被折叠的 条评论
为什么被折叠?



