java入门---网络实例操作之网页抓取

最新推荐文章于 2023-08-05 12:54:37 发布

原创最新推荐文章于 2023-08-05 12:54:37 发布 · 270 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#java #网络实例操作 #网页抓取

原创同时被 2 个专栏收录

868 篇文章

订阅专栏

Java学习之路

216 篇文章

订阅专栏

本文介绍了一个使用Java语言实现的简单网页抓取程序。通过利用java.net.URL类的URL()构造函数，该程序能够从指定的URL地址读取网页内容，并将其写入本地文件。示例代码展示了如何创建URL对象、读取网页数据并进行文件写入。

以下实例演示了如何使用 net.URL 类的 URL() 构造函数来抓取网页：

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.InputStreamReader;
import java.net.URL;

public class Main {
   public static void main(String[] args)
   throws Exception {
      URL url = new URL("http://www.example.com");
      BufferedReader reader = new BufferedReader
      (new InputStreamReader(url.openStream()));
      BufferedWriter writer = new BufferedWriter
      (new FileWriter("data.html"));
      String line;
      while ((line = reader.readLine()) != null) {
         System.out.println(line);
         writer.write(line);
         writer.newLine();
      }
      reader.close();
      writer.close();
   }
}