哥，如何运用java取得某一链接网址中所有的链接网址并存储？然后我再调用HttpURLConnection判断链接有效性

最新推荐文章于 2025-08-03 13:29:52 发布

原创最新推荐文章于 2025-08-03 13:29:52 发布 · 404 阅读

0 ·

CC 4.0 BY-SA版权

JavaSwing 专栏收录该内容

4 篇文章

订阅专栏

本文介绍了一个简单的Java程序，用于从指定URL抓取页面中的所有链接。通过使用标准的Java库，如URL、InputStream和BufferedReader，该程序能够连接到目标网站（例如百度），读取页面内容，并利用正则表达式匹配并打印出所有找到的链接。

你看这个有用吗?
public static void main(String[] args) throws Exception {
 URL url = new URL("http://www.baidu.com");
 InputStream ins = url.openConnection().getInputStream();
         BufferedReader reader = new BufferedReader(new InputStreamReader(ins));
         String serverReturnData = reader.readLine();
         String allData = "";
         while((serverReturnData = reader.readLine()) != null){
         allData +=serverReturnData;
         }
         String regex = "(https?://[-a-z0-9_.:]+[-\\w~`!@#$%^&*()_+=\\|{};:/?,]*)\'";
         Matcher m = Pattern.compile(regex).matcher(allData);
         while(m.find()){
         System.out.println(m.group(1));
         }
         
 }