package cn.net.badboy.subtitlesystem.util;
import info.monitorenter.cpdetector.io.ASCIIDetector;
import info.monitorenter.cpdetector.io.CodepageDetectorProxy;
import info.monitorenter.cpdetector.io.JChardetFacade;
import info.monitorenter.cpdetector.io.ParsingDetector;
import info.monitorenter.cpdetector.io.UnicodeDetector;
import java.io.File;
public class FileUtil {
/**
* 获取文件编码
* @param file
* @return
*/
public static String getFileEncoding(File file){
try{
CodepageDetectorProxy detector = CodepageDetectorProxy.getInstance();
detector.add(new ParsingDetector(false));
detector.add(JChardetFacade.getInstance());
detector.add(ASCIIDetector.getInstance());
detector.add(UnicodeDetector.getInstance());
java.nio.charset.Charset charset = detector.detectCodepage(file.toURI().toURL());
if (charset!=null) {
if (charset.name().equalsIgnoreCase("windows-1252")) {
return "Unicode";
}
return charset.name();
}
return "UTF-8";
}catch(Exception e){
e.printStackTrace();
return "UTF-8";
}
}
}
需要用到这个内裤:
http://cpdetector.sourceforge.net/
本文介绍了一个用于检测文件编码的Java工具类。该工具类通过多种编码检测器组合使用,包括ASCII、Unicode等,来准确判断文件的编码格式。如果检测到的编码为windows-1252,则返回'Unicode'。
1166

被折叠的 条评论
为什么被折叠?



