转自优快云以作备份,使用java获取文档的编码格式

本文介绍了一种使用Java实现的文件编码检测方法,通过引入cpdetector库,能够准确地识别文件的实际编码格式,解决了文件读取时可能出现的乱码问题。文中提供了完整的代码示例,包括如何使用该库进行文件编码的检测。

package com.util.mail; import java.io.File; import java.nio.charset.Charset; import cpdetector.io.CodepageDetectorProxy; import cpdetector.io.JChardetFacade; /** * 需要借助cpdetector jar包下载地址:http://d.download.youkuaiyun.com/down/1815149/wnjok,或者下载我的附件 */ public class CharacterEnding { public static void main(String[] args) { String encoding = CharacterEnding.getFileCharacterEnding("Sty.xml"); System.out.println("encoding = " + encoding); } public static String getFileCharacterEnding(String filePath) { File file = new File(filePath); return getFileCharacterEnding(file); } public static String getFileCharacterEnding(File file) { String fileCharacterEnding = "UTF-8"; cpdetector.io.CodepageDetectorProxy detector = CodepageDetectorProxy.getInstance(); detector.add(JChardetFacade.getInstance()); Charset charset = null; try { charset = detector.detectCodepage(file.toURL()); } catch (Exception e) { e.printStackTrace(); } if (charset != null) { fileCharacterEnding = charset.name(); } return fileCharacterEnding; } }

 

 

如果用io流读文件可以使用

 

FileInputStream fiss = new FileInputStream(sSaveFile);
InputStreamReader fis = new InputStreamReader(fiss, stringCharSet);
StringBuffer sb = new StringBuffer();
BufferedReader br = new BufferedReader(fis);
String line = br.readLine();
while(line!=null && line.length()>0){
     sb.append(line);
     line = br.readLine();
}

 这样子读出的字符串就不是乱码了

打开下面链接,直接免费下载资源: https://renmaiwang.cn/s/guo6x cpdetector-1.0.7jar是一个可集成多种基础检测功能模块的工具,它为用户提供了一个完整的源码集合,涵盖了行业相关的解决方案。这个jar的源码可以免费下载,为需要在软件开发中实现代码复制检测功能的开发者提供了一个可靠的参考。文件名称列表中含了一个文本文件cpdetector.txt,该文件可能提供了关于工具使用、集成说明或其他重要信息。由于是源码,用户可以对源码进行深入研究和定制,以适应不同的开发需求和环境。通过访问提供的下载链接,学生在满足一定的积分要求后,可以免费下载这一工具。此外,如果积分尚未达标,学生还可以通过maven repository进行下载,从而无需积分即可获取cpdetector-1.0.7jar。这一特性使得学生和开发者都能更加方便地获取并利用这个工具,以实现代码检测的功能。 该工具的开发和发布考虑到了开源共享的原则,鼓励开发者社区通过这种方式共享他们的工成果,并从中受益。源码的开放性意味着用户可以自由地研究工具的工机制,对其进行修改和优化,以满足特定的项目需求。此外,源码的完整性和可用性也保证了工具在不同开发环境中的兼容性和稳定性。 通过对源码的深入分析,开发者可以了解和学习到关于代码复制检测的高级技术,这些技术可以帮助他们更好地进行代码质量控制和知识产权保护。该工具集中的每一个功能模块都被设计来解决特定的问题,并且这些模块可以单独使用或与其他模块协同工,为开发者提供了极大的灵活性。 由于该工具是行业相关,可以预测其检测功能是针对软件开发行业中的代码复用和授权问题。在软件开发中,代码复制现象是一个严重的法律和道德问题。因此,这款工具的出现,对于保障软件质量,维护开发者的权益,以及推动软件产业健康发展具有重要意义。 该工具的
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值