利用GNN进行网络异常检测与推荐系统构建
1. CIDDS - 001数据集预处理
CIDDS - 001数据集包含多种类型的数据,如数值型的持续时间、分类特征(协议、攻击类型等)、时间戳和IP地址等。为了提高模型的准确性,需要对这些数据进行预处理。
1.1 数据编码
- 星期几的独热编码 :从时间戳中提取星期几的信息,并进行独热编码,使列名更具可读性。
df['weekday'] = df['Date first seen'].dt.weekday
df = pd.get_dummies(df, columns=['weekday']).rename(columns = {'weekday_0': 'Monday', 'weekday_1': 'Tuesday', 'weekday_2': 'Wednesday', 'weekday_3': 'Thursday', 'weekday_4': 'Friday', 'weekday_5': 'Saturday', 'weekday_6': 'Sunday'})
- 一天中的时间归一化 :计算一天中的时间,并将其归一化到0到1之间。
df['daytime'] = (df['Date first seen'].dt.second + df['Date first seen'].dt.minute*60 + df
超级会员免费看
订阅专栏 解锁全文
20

被折叠的 条评论
为什么被折叠?



