
爬虫
文章平均质量分 72
chaoren0626
这个作者很懒,什么都没留下…
展开
-
httpclient4.3对cookie的管理
httpclient4.3 对cookie管理非常简单。首先第一步,原创 2014-05-06 17:02:32 · 2340 阅读 · 1 评论 -
java-爬虫部分:关于京东模拟登陆的两种实现
最近要做一个爬虫,需要网站数据,先拿京东开刀。因为我是java开发的,所以最开始的时候,想到了httpClient和htmlunit两个东东,于是开始做实验。网上很久以前流传着一个登陆人人网的例子,我就拿过来照搬了一下,发现不灵,后来才发现是自己没理解人家的精髓。然后用htmlunit去模拟,发现京东的js比较复杂,一位多年爬虫经验的哥们告诉我说htmlunit对js支持的原创 2014-02-27 18:33:05 · 9619 阅读 · 1 评论