互联网自治系统与路由环路研究
自治系统组织映射优化
数据问题与解决思路
在自治系统(AS)与组织的映射中,存在一些问题影响着推理的准确性。以 Nutrien 收购 Ruralco 为例,AS137900 由于未在 PDB 注册且根据 CA2O 无兄弟 AS,被池检测与 Nutrien 的其他两个 AS 分离。若能从自然语言数据中正确提取 AS 与组织的关系,池检测和自动聚类方法将更加精确,利用自然语言处理方法是一种可能的解决方案。
同时,尽管充分利用了 PDB 的知识,但一些数据集中仍未涵盖某些信息,特别是关于合并和收购的内容。一些商业数据库如 Crunchbase 和 Dun & Bradstreet 包含了收购历史和子公司列表等大量信息,但这些数据库既不权威,也不由运营商直接维护,信息验证困难。
与互联网运营商的交互
AS 到组织映射的真实情况只能从互联网运营商处获取,因此与他们进行良性互动极为有益。在构建参考数据集时,联系了 105 个互联网运营商,除去 10 个无法送达的电子邮件地址,共收到 12 条回复。
一方面,区域互联网注册管理机构(RIRs)需要加强监管,确保运营商在电子邮件变更时及时更新联系信息;另一方面,研究人员需要做更多工作来促进与运营商的积极建设性互动。计划创建一个项目网站,展示与 Whois 记录不同的映射,欢迎授权运营商(即拥有 PDB 账户的运营商)验证或修改数据,这也有助于更新数据集和方法。此外,鼓励运营商维护和更新 PDB 和 BGP.tools 等用户维护的公共数据库中的信息,目前 PDB 数据库中仅约 23%的 AS 已注册,提高 PDB 的 AS 覆盖率有助于获得更