我靠,上班eclipse看糗事百科

本文展示了一个简单的Java程序示例,该程序用于从指定网页抓取内容。通过使用URL、BufferedReader等类,程序能够打开一个网络连接并读取网页上的文本数据,同时跳过了HTML标签。
package test; 


import java.io.BufferedReader; 
import java.io.InputStreamReader; 
import java.net.URL; 
import java.util.Scanner; 


public class  NewClass{ 


/** 
* @param args 
*/ 
public static void main(String[] args) { 
StringBuffer sb = new StringBuffer(); 
System.out.println("Please input the page:"); 
while(true) { 
Scanner sc = new Scanner(System.in); 
sb = getUrl(sc.nextInt()); 
System.out.println(sb); 
} 
} 

private static StringBuffer getUrl(int page) { 
StringBuffer sb = new StringBuffer(); 
try { 
URL url = new URL("http://www.qiushibaike.com/month/page/"+page+"?s=4595690&slow"); 
InputStreamReader in = new InputStreamReader(url.openStream(),"UTF-8"); 
BufferedReader br = new BufferedReader(in); 
String line; 
while((line = br.readLine())!=null) { 
if(line!=null && !line.isEmpty() &&line.charAt(0) == '<'){ 
continue; 
} 
sb.append("\n"+changeLine(line)); 
} 
} catch (Exception e) { 
// TODO Auto-generated catch block 
e.printStackTrace(); 
} 
return sb; 
} 

private static String changeLine(String line) { 
StringBuffer sb = new StringBuffer(line); 
for(int i = 0;i < line.length()/70 ; i++) { 
sb.insert((i+1)*70, "\n"); 
} 
return sb.toString(); 
} 
}

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值