
爬虫
pSomng
欢迎访问我的个人博客了解我
展开
-
Java爬虫入门(一)使用HttpClient发起Get 或Post请求
掘金原文 传送门本文参考Java 爬虫学习(一)关于 HttpClient 发起 Get 、Post 请求(想要了解其详细的 可点击此处)使用HtttpClient模拟客户端爬取网页数据,总的来说,无非就是三个大步骤:创建HttClient对象(模拟客户端)和设置URI地址发起请求,获取响应(服务器的反应)解析消息的内容(头部,实体等)依据Maven管理的一个项目结构log4...原创 2019-08-20 13:54:28 · 877 阅读 · 0 评论 -
JAVA爬虫入门(二)Jsoup解析数据
掘金原文传送门Jsoup简介对于一个需要爬取网页信息的我来说,jsoup的存在无疑是减轻了很多负担。使用Jsoup的一些API可以很方便且快捷的获取到我们想要的内容。jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。 它的主...原创 2019-08-20 13:56:41 · 223 阅读 · 0 评论 -
Java爬虫入门(三)爬取京东上手机信息(Springboot)
掘金原文传送门说在开头的话:以下的代码存在不严谨的做法,可自行更改:)项目结构(使用maven管理)application.properties#DB Configurationspring.datasource.driver-class-name=com.mysql.cj.jdbc.Driverspring.datasource.url=jdbc:mysql://127.0.0.1...原创 2019-08-20 13:59:09 · 561 阅读 · 0 评论 -
java爬虫实战项目(Spring boot +Selenium)
前面已经学会的简单的JAVA爬虫,那么我们可以开始实战,若没有看博主前面的几篇的文章的,可以去先看看。传送门1项目地址:传送门2如果你喜欢的话,记得给个star,Thank!...原创 2019-08-20 14:10:39 · 1430 阅读 · 0 评论