迈向自动化:对Tor隐藏服务进行分类的探索
1. 引言
“暗网”这个名字,总会让人联想到一个神秘莫测的地下世界,它隐匿于神秘的服务器之中,躲开了执法部门的视线。虽然像洋葱路由(Tor)这样的网络,其初衷是为那些存在政治审查的国家提供言论自由的渠道,但如今它似乎已沦为一个充斥着犯罪活动的虚拟地带,毒品、枪支、儿童不雅图像、洗钱以及其他非法服务在这里肆意交易。2015年,澳大利亚电视新闻节目《60分钟》将暗网描述为“占据互联网90%的庞大、隐秘的网络地下世界”,近期也有报道称,毒品交易正从街头转向暗网。
不过,“暗网占据互联网90%”的说法被认为是不准确的,其他研究表明,任何时候暗网的活跃网站数量大约在30000个左右。监测暗网是一项艰巨的任务,因为没有中央机构存储所有的洋葱地址,而且隐藏服务之间很少相互链接,传统的网络爬虫技术在暗网的应用十分有限。因此,需要识别大量的网站,并逐一筛选,以确定哪些网站值得进一步调查,哪些只是倡导言论自由、促进人权、揭露黑幕或仅仅是分享猫咪图片的网站。
在数字取证领域,当前的一个研究挑战是如何快速地从大量已发布的隐藏服务中抓取数据,收集并存储网站的HTML内容,然后根据关键词列表自动对网站进行分类,以确定其涉及的犯罪类型。目标是设计一个系统,能够每周快速提供可审查的结果,而不是花费数月甚至数周的时间来分析数据。
本文提出了一种方法,可自动从暗网网站收集数据,将其分类到不同的犯罪类别中,并识别出可能对执法部门有潜在价值的网站。该方法还可以在一定程度上估算暗网的真实规模和构成,确定暗网中与犯罪活动相关的比例。此外,还进行了一项实验,在Tor网络上设置并托管了一个隐藏服务。
2. 文献综述
虽然
超级会员免费看
订阅专栏 解锁全文
1339

被折叠的 条评论
为什么被折叠?



