package moforcn.test.regexp;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class RegExp {
private static String STR="欢迎大家访问http://hos_my.andcc.com/wuxin.shtml?method=12 同时我们www.sohu.com热诚www.sohu.com的希望您加入http://www.sina.com/?baidu房间诶";
public static void main(String[] args) {
if(STR.lastIndexOf("http://")!=-1 || STR.lastIndexOf("www.")!=-1){
String[] noChineseStr=STR.replaceAll("[//u4e00-//u9fa5]"," ").split(" ");
Pattern pattern1=Pattern.compile("www//.[//w&&[^//.]]+//.[//w.]/?//S*");
for(int i=0;i
Matcher matcher=pattern1.matcher(noChineseStr[i]);
if(matcher.find()){
String temp1=matcher.group();
prt(temp1);
if(STR.lastIndexOf("http://"+temp1)!=-1){
}else{
STR=STR.replace(temp1, ""+temp1+"");
}
}
}
Pattern pattern2=Pattern.compile("http://[//w&&[^//.]]+//.[//w.]/?//S*");
for(int i=0;i
Matcher matcher=pattern2.matcher(noChineseStr[i]);
if(matcher.find()){
String temp2=matcher.group();
prt(temp2);
STR=STR.replace(temp2, ""+temp2+"");
}
}
}
STR=STR.replaceAll("##temp##", "");
prt(STR);
}
public static void prt(Object o){
System.out.println(o);
}
}
正则表达式匹配URL
该代码段展示了如何使用Java的正则表达式从字符串中提取URL。它首先移除所有中文字符,然后通过两个正则模式分别匹配以'www.'和'http://'开头的URL,并替换为带高亮的格式。
1420

被折叠的 条评论
为什么被折叠?



