JAVA爬虫
「已注销」
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
WebMagic爬取豆瓣读书的书籍数据
本次案例主要是爬取豆瓣读书的标签列表以及每个标签下的书籍名称、对应的URL,然后输出到控制台。 1、引入webmagic的依赖 <!-- webmagic爬虫 --> <dependency> <groupId>us.codecraft</groupId> <artifactId&原创 2018-12-16 12:07:28 · 944 阅读 · 0 评论 -
java调用phantomjs爬取动态网页
1、下载phantomjs。phantomjs的下载地址:http://npm.taobao.org/dist/phantomjs/ 2、将压缩包解压到自己选择的一个地址(我选的是D:\software\phantomjs) 3、编写js文件,我将js文件放在D:\software\phantomjs\codes.js,该路径会在java程序中以绝对路径调用。 //codes.js system ...转载 2019-02-12 22:23:48 · 806 阅读 · 0 评论
分享