2、清理网络：从内部开始保障网络安全

QuietPulse

于 2025-10-02 12:19:24 发布

阅读量13

点赞数

CC 4.0 BY-SA版权

分类专栏：动态网络管理新范式文章标签：网络安全垃圾邮件检测主机聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/c2d3e4f/article/details/153773786

动态网络管理新范式专栏收录该内容

22 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

清理网络：从内部开始保障网络安全

1. 垃圾邮件发送者检测

在检测垃圾邮件发送者时，采用了一种快速且简单的方法。若主机发送的电子邮件数量和字节数高于观察到的平均值加上一定倍数的标准差，就会被视为垃圾邮件发送者。具体公式如下：
[
(ni > avgn + \sigma stdn) \text{ 或 } (bi > avgb + \gamma stdb)
]
在本文中，基于初步实验，(\gamma) 和 (\sigma) 都设为 3。满足此条件的主机构成集合 (S)，该集合通过对所有电子邮件发送者进行线性迭代构建。

2. 电子邮件发送者聚类

在开始聚类算法之前，需要为每个单独的流获取以下元组：<源 IP 地址，目的 IP 地址，目的 UDP/TCP 端口，字节数，数据包数>。之后，将这些流分为两个子集：
- (F_s)：包含与垃圾邮件发送者相关的所有流。
- (F_a)：包含其他机器的所有剩余流。

然后，为每个流 (f \in {F_s \cup F_a}) 计算之前定义的指标（(f_{ph}f)，(pp_ff)，(bpp_f)）。

为降低计算复杂度，首次聚类过程聚焦于可疑 IP 地址（潜在垃圾邮件发送者），并创建包含 (F_s) 聚合流信息的聚类。由于缺乏先验知识，需要进行无监督聚类。同时，由于不假设聚类的形状，因此采用最近邻聚类算法。基于中心点的方法因计算开销大而被排除。

最近邻聚类假设，如果两个数据点之间的距离 (dist(d_1, d_2)) 低于阈值 (\theta)，则它们属于同一聚类。在本文中，每个数据点表示为向量 ([f

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。