功能需求:
URL的字符串匹配,但又不能包含指定的字符串
URL为我的ITEYE空间:http://hugh-wangp.iteye.com/
我想统计我ITEYE空间的流量,但是又不想知道微博(weibo)和收藏(link)的流量
所有我要在匹配:http://hugh-wangp.iteye.com的同时,URL里又不能有weibo和link字符串
功能实现:
//待匹配的正则表达式
String reg= "^http://hugh-wangp\\.iteye\\.com/(?!.*((weibo)|(link))).*$";
System.out.println("http://hugh-wangp.iteye.com/".matches(reg));//通过
System.out.println("http://hugh-wangp.iteye.com/blog".matches(reg));//通过
System.out.println("http://hugh-wangp.iteye.com/blog/guest_book".matches(reg));//通过
System.out.println("http://hugh-wangp.iteye.com/weibo".matches(reg));//不通过
System.out.println("http://hugh-wangp.iteye.com/link".matches(reg));//不通过
参考:
本文介绍了一种使用正则表达式进行URL匹配的方法,该方法能够精确地统计特定网站的访问量,同时排除某些子路径的数据。具体实现了对于指定域名下除微博和收藏外的所有页面流量的统计。
653

被折叠的 条评论
为什么被折叠?



