写一段代码把http://www.baidu.com 的源代码的前三行打印出来。
package com;
public class TestIo {
public static void main(String[] args) {
System.out.println(new TestIo().getHtml("http://www.baidu.com"));
}
private String getHtml(String urlString) {
try {
StringBuffer html = new StringBuffer();
java.net.URL url = new java.net.URL(urlString); // 根据 String表示形式创建URL 对象。
java.net.HttpURLConnection conn = (java.net.HttpURLConnection) url
.openConnection();// 返回一个 URLConnection 对象,它表示到 URL
// 所引用的远程对象的连接。
java.io.InputStreamReader isr = new java.io.InputStreamReader(
conn.getInputStream());// 返回从此打开的连接读取的输入流。
java.io.BufferedReader br = new java.io.BufferedReader(isr);// 创建一个使用默认大小输入缓冲区的缓冲字符输入流。
String temp;
while ((temp = br.readLine()) != null) { // 按行读取输出流
if (!temp.trim().equals("")) {
html.append(temp).append("\n"); // 读完每行后换行
}
}
br.close(); // 关闭
isr.close(); // 关闭
return html.toString(); // 返回此序列中数据的字符串表示形式。
} catch (Exception e) {
e.printStackTrace();
return null;
}
}
}
本文介绍了一种通过Java编程语言抓取指定网址源代码的方法,并实现了打印出目标网站http://www.baidu.com源代码的前三行。
1532

被折叠的 条评论
为什么被折叠?



