
网络编程
xingfudage1986
这个作者很懒,什么都没留下…
展开
-
TIME_WAIT的一些知识
Socket中的TIME_WAIT状态在高并发短连接的server端,当server处理完client的请求后立刻closesocket此时会出现time_wait状态然后如果client再并发2000个连接,此时部分连接就连接不上了,用linger强制关闭可以解决此问题,但转载 2011-10-10 19:36:38 · 465 阅读 · 0 评论 -
网路爬虫--url索引
url索引的作用是判断一个url是否被抓取过,采用的算法主要是MD5数字签名。假设一共要抓取的url不超过1亿条,用一个二进制的位表示一个url是否被抓取过,则至少需要1亿个位,我们管每一个位叫一个“槽”。考虑到MD5的算法是可能出现冲突(即不同的url算出来的MD5可能相同,这种概率很小),槽越少,冲突越明显,所以槽越多越好。但另一方面,还要考虑到占用内存的大小,因为在抓取的过程中,为了保证转载 2011-10-11 19:30:34 · 864 阅读 · 0 评论