(一)获取用于网络的utf-8编码。(北京:%e5%b9%bf%e5%b7%9e)
经分析,是“汉字”两个中文字符通过UTF8编码,转换为字节数组,再通过单字节格式化,转换为16进制数的结果。
解析代码如下,
try{
// TODO Auto-generated method stub
String city="广州";
byte b[]=city.getBytes("utf-8");
String str="";
for(int i=0;i<b.length;i++){
str=str+"%"+Integer.toHexString(b[i]).substring(6);
}
System.out.println(str);
}
catch(Exception e){}
(二)读txt文件
byte[] buf=new byte[1000*1024];
InputStream in=getAssets().open("rss.txt");
in.read(buf);
String f[]=EncodingUtils.getString(buf,"GB2312").split("\n");
(三)读utf-8文件(按行读)
BufferedReader br=new BufferedReader(new InputStreamReader(conn.getInputStream(),"utf-8"));