利用java的HttpURLConnection捕获网页信息,同时记录链接的sessionId。
考虑到网页编码方式的不同,自动解析网页内容,并捕获其编码方式,并按该编码方式读取网内容。但也存在一些并非正规网页,捕获不到charset,默认iso-8859-1方式读取网页内容。
其中该处记录sessionId可以为了下次再次访问使用同一个sessionId,欺骗服务器还在同一个会话中,比如登陆验证之类的...。
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
/**
* java访问获取web页面信息
* 可以记录sessionId供登录相关使用...
* @author Arthur126
* @date 2015-8-21 下午10:00:14
*
*/
public class CallHttpTest {
/**
* 网址被访问记录的sessionId
*/
private static String SESSION_ID = "";
public static String callHttp(String callURL) throws Exception {
String result = "";
URL u0 = new URL(callURL);
HttpURLConnectio