- 博客(3)
- 收藏
- 关注
原创 高效的网络爬虫- ETSpider简介
我的开发网络爬虫,暂时取名“ETSpider”,使用C语言编写,是分布式的系统。 ETSpider使用的技术: ================== 1、ETDNS - 异步DNS解析器,比c-ares(http://c-ares.haxx.se/)20倍,比LIBEVENT2 DNS快6倍; 2、ETPARSER - 是一款HTML解析器,比Google/Gumbo-Parser快15倍
2014-11-17 08:44:40
1051
原创 速度奇快的HTML解析器 - ETPARSER 诞生了
这是我自己开发的一个HTML PARSER 解析库,采用C语言实现。单个进程每秒能找出200多万个URL。
2014-11-09 09:27:33
2335
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅