基于机器学习的CAN车辆网络入侵检测与伪装检测
1. 数据集概述
使用了四个数据集,前两个用于分类实验,后两个用于伪装检测实验。具体信息如下表所示:
| 数据集编号 | 用途 |
| ---- | ---- |
| 1 | 分类实验 |
| 2 | 分类实验 |
| 3 | 伪装检测实验 |
| 4 | 伪装检测实验 |
2. 特征提取
- 十进制转换 :将每个CAN消息转换为十进制等价物,将这些十进制数作为观测值,并基于数字序列训练模型。
- Word2Vec嵌入 :将Word2Vec词嵌入技术应用于CAN数据包(作为数字)。基于重叠滑动窗口,考虑长度为五的CAN消息,训练Word2Vec模型,输出向量作为特征集用于部分实验。Word2Vec基于浅层2层神经网络,常用于自然语言处理中查找单词的上下文,它将常见单词分组,适合作为其他机器学习技术的输入。
3. 分类实验
运用多种机器学习模型对CAN数据包进行实验,并尝试使用Word2Vec特征。具体考虑的机器学习技术包括:k近邻(k - NN)、隐马尔可夫模型(HMM)、长短期记忆网络(LSTM)、深度神经网络(DNN)、支持向量机(SVM)和朴素贝叶斯。实验基于数据集1和2,目标是仅从网络数据包中识别车辆状态,不依赖其他信息。
3.1 k - NN实验
分别将k - NN应用于数值CAN数据包和Word2Vec特征,对真实数据和模拟数据进行单独实验,测量区分“空
超级会员免费看
订阅专栏 解锁全文
597

被折叠的 条评论
为什么被折叠?



