package org.spdbflbrain.spark.createRDD;
import java.io.BufferedReader;
import java.io.ByteArrayOutputStream;
import java.io.FileReader;
import org.apache.commons.lang.StringEscapeUtils;
public class UnicodeToString {
public String fileAsString(String fileName){
BufferedReader br = null;
ByteArrayOutputStream bos = null;
try {
br = new BufferedReader(new FileReader(fileName));
bos = new ByteArrayOutputStream();
String line = null;
while ((line = br.readLine()) != null) {
String line2 = StringEscapeUtils.unescapeJava(line);
bos.write(line2.getBytes());
bos.write("\r\n".getBytes());
}
String result = new String(bos.toByteArray());
System.out.println("result:" + result);
return result;
} catch (Exception e) {
e.printStackTrace();
} finally {
if(br != null){
try {
br.close();
} catch (Exception e2) {
// TODO: handle exception
}
}
}
return null;
}
public static void main(String[] args) {
String file = "input/word.txt";
UnicodeToString st = new UnicodeToString();
st.fileAsString(file);
}
}
JAVA中unicode特殊字符转换普通文本
最新推荐文章于 2024-11-27 16:18:08 发布
该代码段展示了一个Java方法,用于读取指定文件的内容,并使用StringEscapeUtils库的unescapeJava方法将其中的Java转义字符转换回原始形式。最后,内容被打印并返回。
3万+

被折叠的 条评论
为什么被折叠?



