汉字编码

本文介绍如何使用Java获取字符串的UTF-8编码形式,并提供了两种读取文件的方法:一种是从TXT文件中读取GB2312编码的内容;另一种是逐行读取UTF-8编码的文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

(一)获取用于网络的utf-8编码。(北京:%e5%b9%bf%e5%b7%9e)

经分析,是“汉字”两个中文字符通过UTF8编码,转换为字节数组,再通过单字节格式化,转换为16进制数的结果。
解析代码如下,

try{
   // TODO Auto-generated method stub
   String city="广州";
   byte b[]=city.getBytes("utf-8");
   String str="";
   for(int i=0;i<b.length;i++){
    str=str+"%"+Integer.toHexString(b[i]).substring(6);
   
}
   System.out.println(str);
  }
  catch(Exception e){}

(二)读txt文件

      byte[] buf=new byte[1000*1024];
      InputStream in=getAssets().open("rss.txt");
      in.read(buf);
      String f[]=EncodingUtils.getString(buf,"GB2312").split("\n");

(三)读utf-8文件(按行读)

BufferedReader br=new BufferedReader(new InputStreamReader(conn.getInputStream(),"utf-8"));

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

开源技术之家

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值