关于UTF-8

    Unicode编码中,19968-40869为汉字:

 

摘自一部分:

&#19968-19978一丁丂七丄丅丆万丈三
&#19978-19988上下丌不与丏丐丑丒专
&#19988-19998且丕世丗丘丙业丛东丝
&#19998-20008丞丟丠両丢丣两严並丧
&#20008-20018丨丩个丫丬中丮丯丰丱
&#20018-20028串丳临丵丶丷丸丹为主
&#20028-20038丼丽举丿乀乁乂乃乄久
&#20038-20048乆乇么义乊之乌乍乎乏
&#20048-20058乐乑乒乓乔乕乖乗乘乙

 

 

得到某汉字的编码:

String str = "黎明你好";
for(int j=0; j<str.length(); j++){
	char temp = str.charAt(j);
	System.out.print( "&#" + (int)temp);
}

输出结果:&#40654&#26126&#20320&#22909

把他保存成html,就可以显示汉字。

 

微软word转的mht文件,有的时候title不对,用工具打开直接改title,改完肯定是乱码。

用上面的代码找到他的Unicode编码,copy进去,OK了。

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值