Unicode编码中,19968-40869为汉字:
摘自一部分:
一-19978一丁丂七丄丅丆万丈三
上-19988上下丌不与丏丐丑丒专
且-19998且丕世丗丘丙业丛东丝
丞-20008丞丟丠両丢丣两严並丧
丨-20018丨丩个丫丬中丮丯丰丱
串-20028串丳临丵丶丷丸丹为主
丼-20038丼丽举丿乀乁乂乃乄久
乆-20048乆乇么义乊之乌乍乎乏
乐-20058乐乑乒乓乔乕乖乗乘乙
得到某汉字的编码:
String str = "黎明你好";
for(int j=0; j<str.length(); j++){
char temp = str.charAt(j);
System.out.print( "&#" + (int)temp);
}
输出结果:黎明你好
把他保存成html,就可以显示汉字。
微软word转的mht文件,有的时候title不对,用工具打开直接改title,改完肯定是乱码。
用上面的代码找到他的Unicode编码,copy进去,OK了。