通常在一些网站中,为了防止恶意大量的访问和超大量访问导致内存占满,会对单个链接的连接数和总链接数做出一个限制。
以本FTP服务端为例,假设每个客户链接,我们都需要两个进程来处理它,假设了一个客户需要分配总共1M的栈内存出来,1000个链接,接近1G的内存就没有了。另一方面,如果单个ip大量链接服务端,会占用大量的带宽、内存和文件句柄,实际上每个用户(ip)只需要两三个链接就可以解决问题,所以对单个ip连接数进行限制,有助于维持服务端的性能稳定和防止恶意访问。
在系统自带vsftpd中有如下的配置文件
max_clients=300 最大客户端连接数为300 max_per_ip=10 每个IP最大连接数
现在我们知道,我们需要一个数据结构来存储ip和ip对应的链接数,所以我们首先想到的就是用键值对模型,即每个ip对应一个链接数,并存储起来,并且我们需要能够快速插入、删除和查找,适合的就是树和hash表。但是连接数真的能解决问题吗?
<!-- more -->
首先,何时链接,我们何时增加一个连接数这个毋容置疑,但是,我们要如何知道这个链接结束了呢?我们可以在进程结束的时候,获得进程结束的信号,从而感知到一个进程的结束,所以这个时候,我们就不能单单依靠连接数,而是依靠进程的pid来对应ip。
所以我们需要两个hash表,一个hash表是pid to ip,另一个表是ip to conn。
至于hash_table我们可以自己定制写一个,也可以用stl库中的,但是还是自己写一个吧,我们只需要用到hash_table的部分功能。
下面的函数只是对主要的成员函数进行注释,方便理解(这里并没用泛型,而是借鉴了redis的实现方式用void *实现的hashtable)。
void* hash_lookup_entry(void* key, unsigned int key_size); //寻找并返回key所对应的value, 如value为空,则返回空。 void hash_add_entry(void *key, unsigned int key_size, void *value, unsigned int value_size); //新增一个key-value void hash_free_entry(void *key, unsigned int key_size); //删除一个key-value
下面我们需要两个表
static hash* s_ip_conn_hash; static hash* s_pid_ip_hash;
在接受链接成功后,我们可以获得一个unsigned int类型的ip,我们可以根据这个ip,找到ip所对应的p_count,再对p_count进行操作就完成了ip-conn的创建和增长