关于重定向页面下载的办法 (转)

关于重定向页面下载的办法 (转)[@more@] 

页面重定向一般有两个页面,第一个页面是引导页,利用meta标签的HTTP-EQUIV=REFRESH重新获得新的页面地址。所以可以用一个页面标签解释的办法来取得新的页面地址。

我们采用一个正则表达式

String express = "HTTP-EQUIVs*=s*"*REFRESH"*([^>]*)URLs*=s*([^>]*)>";XML:namespace prefix = o ns = "urn:schemas-microsoft-com:Office:office" />

来匹配引导页。如果匹配到有定向标签的就取得标签中的url,处理相对地址变为绝对地址,然后再下载这个地址的页面,这个过程可以迭代,直到没有匹配到定向标签,最后下载到的页面为最终页面。

 

例子代码:

  private boolean tryRedirect(StringBuffer sb){

  String text = sb.toString();//取得页面正文

  if(matcher.contains(text,pattern)){//如果匹配表达式成功

  MatchResult result = matcher.getMatch();

  String url = result.group(2);//取得标签里面的新地址

  url = url.trim();

  if(url.charAt(url.length()-1)=='''){

  url = url.substring(0,url.length()-1);

  }

  if(url.charAt(url.length()-1)=='"'){

  url = url.substring(0,url.length()-1);

  }

  //转换相对地址为绝对地址

  currentURL=com.westwind.infogate.util.URLProcess.RelativelyToFull(url,currentURL);

  if(currentURL==null)

  return false;

  currentURL = URLProcess.addHttphead(currentURL);

  return true;

  }

 return false;

}

 


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/10752019/viewspace-975318/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/10752019/viewspace-975318/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值