以下实例演示了如何使用 net.URL 类的 URL() 构造函数来抓取网页:
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.InputStreamReader;
import java.net.URL;
public class Main {
public static void main(String[] args)
throws Exception {
URL url = new URL("http://www.example.com");
BufferedReader reader = new BufferedReader
(new InputStreamReader(url.openStream()));
BufferedWriter writer = new BufferedWriter
(new FileWriter("data.html"));
String line;
while ((line = reader.readLine()) != null) {
System.out.println(line);
writer.write(line);
writer.newLine();
}
reader.close();
writer.close();
}
}

本文介绍了一个使用Java语言实现的简单网页抓取程序。通过利用java.net.URL类的URL()构造函数,该程序能够从指定的URL地址读取网页内容,并将其写入本地文件。示例代码展示了如何创建URL对象、读取网页数据并进行文件写入。
1631

被折叠的 条评论
为什么被折叠?



