15、暗网流量分析与知识图谱聊天机器人开发

暗网流量分析与知识图谱聊天机器人开发

1 暗网流量分析

1.1 暗网网络数据及数据集详情

暗网网络存在多种流量类别,不同类别对应不同的应用程序,具体如下表所示:
| 流量类别 | 应用程序 |
| — | — |
| 音频流 | Vimeo 和 YouTube |
| 浏览 | Firefox |
| 聊天 | ICQ、AIM、Skype、Facebook |
| 电子邮件 | SMTPS、POP3 和 IMAPS |
| P2P | utTorrent 和 BitTorrent |
| 视频流 | Vimeo 和 YouTube |
| VOIP | Facebook、Skype 和 Hangout |

本研究使用的数据集是 CICDarknet2020 数据集,包含良性和暗网流量。该数据集分为两层,一层表示正常流量,另一层表示来自 Tor 或 VPN 的恶意流量。数据集中总共有约 158,659 个条目,其中正常数据包有 134,348 个,暗网数据包有 24,311 个,音频流的数据包数量最多。具体流量详情如下表:
| 流量类别 | 数据包数量 |
| — | — |
| 正常流量 | 134,348 |
| 暗网流量 | 24,311 |
| 总计 | 158,659 |

1.2 特征选择

特征选择在机器学习应用中至关重要。选择数据中的最佳特征不仅能提高准确性,还能使系统在时间和内存方面更高效。本研究使用特征重要性方法进行特征选择,这是基于树的分类器自带的类。具体实现时,采用额外树分类器

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值