
爬虫
隔叶听风
随缘更新
展开
-
Java实现网络爬虫:爬取京东商品案例
Java实现网络爬虫爬取京东商品案例需求分析代码实现爬取京东商品案例需求分析一、需求抓取京东商城的数据,把商品数据保存到数据库。二、功能分析使用HttpClient发送一个get请求,请求搜索url,得到商品列表使用jsoup解析搜索结果页面。把商品信息封装一个对象中。把商品数据保存到数据库。三、京东页面分析当在京东的搜索框输入手机时,此时的url为https://search.jd.com/Search?keyword=手机&wq=手机&page=1&s原创 2020-07-12 16:23:36 · 2187 阅读 · 0 评论 -
Java实现网络爬虫:Jsoup解析页面
Java实现网络爬虫Jsoup介绍document的常用api使用css选择器解析页面Jsoup介绍jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。一、使用方法1)使用Jsoup工具类提供的方法parse,解析html,parse的参数可以是url、本地文件、String(html)、InputStream解析之后得到一个Document对象。2)可以使原创 2020-07-12 14:57:00 · 472 阅读 · 0 评论 -
Java实现网络爬虫:HttpClient抓取https协议页面
Java实现网络爬虫HttpClient:爬虫介绍,爬虫的抓取环节,使用HttpClient发送get请求,使用HttpClient发送post请求,HttpClient连接池,HttpClient抓取https协议页面。原创 2020-07-11 15:11:20 · 3849 阅读 · 3 评论