java html获取_Java解析html页面,获取想要的元素

这篇博客介绍了如何在Java中使用Jsoup库来解析HTML页面并获取所需元素。内容包括通过CSS选择器获取商品标题、静态页面标题以及textarea中的详细说明。提供了一些实用的代码示例和推荐的学习资源。

背景:通过接口访问数据,获取的内容是个标准的html格式,使用jsoup的方式获取页面元素值

先推荐比较好的博客:http://www.open-open.com/jsoup/、 单个案例比较不错

http://blog.youkuaiyun.com/u010814849/article/details/52526582  整合内容很多

1.插件下载并安装

2.使用(目前都是用的css方式定位元素)

1.获取这个网页的商品标题内容

09289e91bf7c80fa7fcf8080ff66fd54.png

代码说明:response为页面的网页元素,一个标准的html

Document doc = Jsoup.parse(resopnes); //使用jsoup 进行语言转换

String getTitle = doc.select("#goods_title").attr("value");//商品标题 #使用css方式

7efdb4b394ee96bf2291dcafe27ce6e6.png

2. 获取静态页面的标题,元素input

0d66ae4fdff15fac82f9c79088c5fd06.png

可直接使用浏览器的css方式:#showtab0 > tbody > tr:nth-child(2) > td:nth-child(2) > input.input_style

Document doc = Jsoup.parse(resopnes); // 使用jsoup 进行语言转换

String getProductName = doc.select("#showtab0 > tbody > tr:nth-child(2) > td:nth-child(2) > input.input_style").attr("value");

System.out.println("商品名称:"+getProductName);

abc69ef430994c2fc8564b9b7f4b225a.png

3.获取其他说明,元素为textarea

bdfb3fa6bca28764930835a3b3c6f94c.png

String detail = doc.select("#goods_desc_en").text();//详细描述

System.out.println("详细描述"+detail);

e58d2dea5fc3bf4689002bc25c051418.png

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值