实现原理
实现起来挺简单的,就是通过url访问你需要抓取的网站,使用正则表达式去匹配网页中的内容,然后将匹配的结果放在本地的一个txt文件中,在使用的时候直接使用即可(不能用来做坏事噢)
代码
import java.io.*;
import java.util.regex.*;
import java.net.*;
public class MailTest{
public static void main(String[] args) throws Exception{
getMailAddr();
}
public static void getMailAddr()throws Exception{
URL url=new URL("http://blog.sina.com.cn/s/blog_515617e60101e151.html");
URLConnection con=url.openConnection();
BufferedReader bufIn=new BufferedReader(new InputStreamReader(con.getInputStream()));
BufferedWriter bufw=new BufferedWriter(new FileWriter(new File("D:\\mailaddress2.txt")));
String str=null;
String regex="[a-zA-Z0-9_]{6,12}@[a-zA-Z0-9]+(.[a-zA-Z]+)+";
Pattern p=Pattern.compile(regex);
System.out.println("start");
while((str=bufIn.readLine())!=null) {
Matcher m=p.matcher(str);
while(m.find()){
String ss=m.group();
bufw.write(ss,0,ss.length());
bufw.newLine();
bufw.flush();
}
}
System.out.println("end");
}
}
想要发邮件??
使用java发送邮件