javaIO应用

最新推荐文章于 2024-06-12 17:41:16 发布

原创最新推荐文章于 2024-06-12 17:41:16 发布 · 151 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#Java #.net #HTML

java总结专栏收录该内容

3 篇文章

订阅专栏

本文介绍了一种通过Java编程语言抓取指定网址源代码的方法，并实现了打印出目标网站http://www.baidu.com源代码的前三行。

写一段代码把http://www.baidu.com 的源代码的前三行打印出来。

package com;

public class TestIo {
    public static void main(String[] args) {
        System.out.println(new TestIo().getHtml("http://www.baidu.com"));
    }

    private String getHtml(String urlString) {
        try {
            StringBuffer html = new StringBuffer();
            java.net.URL url = new java.net.URL(urlString); // 根据 String表示形式创建URL 对象。
            java.net.HttpURLConnection conn = (java.net.HttpURLConnection) url
                    .openConnection();// 返回一个 URLConnection 对象，它表示到 URL
            // 所引用的远程对象的连接。
            java.io.InputStreamReader isr = new java.io.InputStreamReader(
                    conn.getInputStream());// 返回从此打开的连接读取的输入流。
            java.io.BufferedReader br = new java.io.BufferedReader(isr);// 创建一个使用默认大小输入缓冲区的缓冲字符输入流。

            String temp;
            while ((temp = br.readLine()) != null) { // 按行读取输出流
                if (!temp.trim().equals("")) {
                    html.append(temp).append("\n"); // 读完每行后换行
                }
            }
            br.close(); // 关闭
            isr.close(); // 关闭
            return html.toString(); // 返回此序列中数据的字符串表示形式。
        } catch (Exception e) {
            e.printStackTrace();
            return null;
        }
    }
}