
爬虫
txf_7337
这个作者很懒,什么都没留下…
展开
-
针对商品信息抽取-雏形程序-java语言
第一次在iteye上写博客,这个程序是根据公司的需求+个人的想法=针对商品信息抽取的第一个版本 源代码地址:[url]https://github.com/txf7337/dabao-spider[/url] [b]基本配置[/b] jdbc数据库 //mysql测试过 文件下载,文字识别的线程数以及线程爬取的间隔 任务周期 文件保存目录 [b]代理的配置[/b] ...原创 2012-10-16 15:01:14 · 143 阅读 · 0 评论 -
django_dynamic_scraper
DDS是一个基于python语言的爬虫,是对django和scrapy的一个整合,现在还处于aphla阶段,相信不久就将发布beta版。 支持interval和crontab [img]http://dl.iteye.com/upload/attachment/0075/1214/61593a02-11c4-3c49-a67e-d2c4f9059f3e.png[/img] 使用django的...原创 2012-10-16 15:15:56 · 210 阅读 · 0 评论