读取UTF-8文件时时,在开始处常常有一个65279值。
微软在自己的UTF-8格式的文本文件之前加上了EF BB BF三个字节,三个不可见的字符(0xEF 0xBB 0xBF,即BOM)UTF-8的格式签名,
二进制是65279不可打印字符,电脑上显示问号,手机上显示一方块
解决方法:用UltraEdit打开,另存为——格式 选择 UTF-8 无 BOM
或者自己写个程序,让程序生成一个文件。
j2me一般编程处理方法(下面的方法返回UTF-8格式TXT文件的全部内容):
private String a()
{
String s;
try
{
InputStream inputstream = getClass().getResourceAsStream("/help.txt"); //可作为参数传入,增加灵活性
byte[] abyte0 = new byte[inputstream.available()];
inputstream.read(abyte0);
inputstream.close();
s = new String(abyte0, "UTF-8");
if(s.charAt(0)==65279) s=str.substring(1,str.length());
/*UTF-8的格式签名65279,电脑上显示问号,手机上显示一方块,在此进行处理*/
}
catch(IOException ioexception)
{
s = new String("");
}
return s;
}
本文介绍了解决UTF-8文件中出现的65279值(BOM标记)问题的方法,包括使用UltraEdit软件去除BOM及通过Java代码处理BOM。
712

被折叠的 条评论
为什么被折叠?



