JSoup获取指定页面指定URL

最新推荐文章于 2024-04-19 20:11:48 发布

csucaicai

最新推荐文章于 2024-04-19 20:11:48 发布

阅读量3k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： JSoup 文章标签： jsoup获取URLJsoup入门实践

本文链接：https://blog.youkuaiyun.com/csucaicai/article/details/19608459

JSoup 专栏收录该内容

1 篇文章

订阅专栏

本文介绍了一种使用Jsoup库从指定URL抓取网页元素的方法，特别是获取页面上的链接（href）和空白（blank）值。通过Java代码示例展示了如何连接到soku.com并提取搜索结果中的视频列表URL。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近在自学Jsoup,不多说,看代码吧,是指定URL,之后获取页面上相应的URL地址和blank值

最好的学习方法就是给自己找牛刀小试的机会,系统而理论的学习时间太长,还不一定玩的溜

配置我是用的maven,里边的包可用search maven来找到相应的dependency,或者你自己下

也是可以的,这都不是关键

import java.io.IOException;

import org.jsoup.Jsoup;

import org.jsoup.nodes.Document;

import org.jsoup.nodes.Element;

import org.jsoup.select.Elements;

/**
* Get URL.
*
* @author Seven 2014.02.21
*/
public class Test {
public static void main(String[] args) {
// 根据soku的地址，获取视频中相应列表的URL和blank值
Document document = null;
try {
document = Jsoup
.connect(
"http://www.soku.com/v?keyword=%E5%8D%95%E6%81%8B%E5%8F%8C%E5%9F%8E")
.get();
} catch (IOException e) {
e.printStackTrace();
}
Element element = document.body();
Element ele = element.getElementsByClass("panel_15").get(0)
.getElementById("group1");
Elements s = ele.getElementsByTag("li");
for (int i = 0; i < s.size(); i++) {
String blank = s.get(i).childNode(0).childNode(0).toString();
System.out.print(s.get(i).childNode(0).attr("href"));
System.out.println(" blank=" + blank);
}
}
}