
JAVA 爬虫
Yeung先森
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Java:java爬虫获取动态网页的数据
说明: 只是分享一种解决方案,代码以及部分截图不方便贴出,请谅解! 前段时间一直在研究爬虫,抓取网络上的特定的数据,如果只是静态网页就是再简单不过了,直接使用Jsoup : Document doc = Jsoup.connect(url).timeout(2000).get(); 1 获取到Document 然后就想干嘛就干嘛了,但是一旦碰到一些动态生成的网站就不行了,由于数据是网页加载...转载 2018-09-30 19:28:43 · 1430 阅读 · 0 评论 -
使用fiddle抓包使用教程
转载出处:https://www.cnblogs.com/zhaoyanjun/p/7068905.html Fiddler是什么? Fiddler是一个http调试代理,它能 够记录所有的你电脑和互联网之间的http通讯,Fiddler 可以也可以让你检查所有的http通讯,设置断点,以及Fiddle 所有的“进出”的数据(指cookie,html,js,css等文件,这些都可以让你胡...转载 2018-09-30 19:32:13 · 2045 阅读 · 1 评论 -
[Jsoup] 使用HtmlUnit + Jsoup解析js动态生成的网页
版权所有: bluetata dietime1943@gmail.com 本文地址: http://blog.youkuaiyun.com/dietime1943/article/details/79035779 转载请注明来源/作者 在使用Jsoup过程中会遇到无法解析通过javascript动态生成的html网页, 在Jsoup交流群中也经常会有人问到这个问题, 本文的解决办法是使用HtmlUni...转载 2018-09-30 19:37:31 · 814 阅读 · 0 评论