关于java读取文件时遇到Unicode乱码情况

最新推荐文章于 2021-07-21 20:22:23 发布

原创最新推荐文章于 2021-07-21 20:22:23 发布 · 1.8k 阅读

0 ·

CC 4.0 BY-SA版权

java 同时被 2 个专栏收录

21 篇文章

订阅专栏

异常管理

14 篇文章

订阅专栏

本文介绍了一个关于使用Java读取.dat文件时遇到的问题：文件采用Unicode编码导致读取内容异常。通过更改文件编码为UTF-8解决了该问题。

今天在做项目时遇到一个很简单又好纠结的问题：

test.dat文件内容：

10000111122222222212345678901234567890000209991234567890123N                    344000000000000          
10000100014012345678901234567891234567890123051301                      1234567890abcde                  
1001000011234567890123

用java读.dat文件时出现以下情况：

在Eclipse控制台中看到以下输出：

刚开始还以为是每个数字之间有空格，就用str.replaceAll("\\s*","");来消除所有空格，没想到是怎么搞都去除不了空格。搞了几个小时之后打开log日志文件查看，发现以下情况：

在log日志文件看到以下情况

从中看到似乎一个字符都包含两个字节在里面，从一个论坛中看到可能与Unicode编码有关，于是朝着这个思路去寻找解决方案。

用EditPlus编辑工具打开test.dat文件，查看该文件编码发现是“Unicode”编码，把它改回“UTF-8”编码，再读文件看看，果然正常了

Unicode编码中每一个字符都有两个字节的。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ChenAllen1025

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

java读ansi文件乱码,Java 读取ANSI文件中文乱码问题解决方式[转]

weixin_29483167的博客

03-16

1738

第一步：首先判断源文件的编码格式：按照给定的字符集存储文件时，在文件的最开头的三个字节中就有可能存储着编码信息，所以，基本的原理就是只要读出文件前三个字节，判定这些字节的值，就可以得知其编码的格式。其实，如果项目运行的平台就是中文操作系统，如果这些文本文件在项目内产生，即开发人员可以控制文本的编码格式，只要判定两种常见的编码就可以了：GBK和UTF-8。由于中文Windows默认的编码是GBK，所...

Java读取TXT文本文件乱码解决方案(1).doc

最新发布

07-23

首先，当Java程序在读取TXT文本文件时遇到乱码，通常是因为编码格式不一致导致的。在上述案例中，最初使用的方法是通过BufferedReader和FileReader来读取文件，但这会导致读取非ANSI编码的TXT文件时出现乱码。因为...

参与评论您还未登录，请先登录后发表或查看评论

java读写文件中文乱码问题

Jevon's Blog

11-03

4741

作为学计算机的，写程序总会遇到很多头疼的东西，程序中的中文支持就是其中一个很令人无柰的问题。唉，有时只能感慨，谁叫计算机、语言等等都是老外发明的呢，别人的26个字母多easy，写程序、软件也就不会有这么多问题了。我们写程序就不得不考虑中文的问题，用别人的软件英文不好的还得到处找汉化包，看别人的文档，全是英文，写自己的程序，还不得不考虑中文的问题。我们做一个专家系统的项目，术语太多

java读取dat文件乱码，看这篇足矣了！

qq_38514574的博客

07-21

1991

正文如果你参加过一些大厂面试，肯定会遇到一些开放性的问题： 1、写一段程序，让其运行时的表现为触发了5次Young GC、3次Full GC、然后3次Young GC； 2、如果一个Java进程突然消失了，你会怎么去排查这种问题？ 3、给了一段Spring加载Bean的代码片段，阐述一下具体的执行流程？是不是看上去很难，是不是和自己准备的“题库”中的问题不一样？不知道从何处下手？如果你有这种感觉，那么说明你的技术还需要继续修炼。面对如此多的技术面试，怎么样才能说自己的技术已经过关了呢？只有

java web 开发 unicode 乱码解决方案

08-20

常用java转码方法，以及绕过web服务器二次编码技术。

java读取dat文件乱码_Java中读取txt文件中中文字符时，出现乱码的解决办法

weixin_35822534的博客

02-16

1894

这是我写的一个Java课程作业时，遇到的问题。问题描述：我要实现的就是将txt文件中的内容按一定格式读取出来后，存放在相应的数组。我刚开始运行时发现，英文可以实现，但是中文字符就是各种乱码。最后各种检查排错得到原因如下：(1)最好先检查你的Eclipse中的Window->Preference->General->WorkSpace中的字符编码格式是什么，最后选成UTF-8格式的...

java读取配置文件(properties)的时候,unicode码转utf-8——java改变默认Unicode编码显示中文

tanghuan0827的博客

07-17

858

有时我们在读取properties结尾的配置文件的时候,如果配置文件中有中文,那么我们读取到的是unicode码的中文,需要我们在转换一下,代码如下 /** * 将配置文件中的Unicode 转 utf-8 汉字 * @param 原始字符串 * @return 转换后的格式的字符串 */ public static String unicodeToChina(String str) { Charset set = Charse

Java读取TXT文本文件乱码解决方案.doc

09-30

"Java读取TXT文本文件乱码解决方案" Java 读取 TXT 文本文件乱码解决方案中，主要讨论的是在 Java 中读取 TXT 文本文件时出现乱码的问题，并提供了解决方案。首先，文章中提供了一个简单的读取 TXT 文件的代码，...

Java读取、写入文件如何解决乱码问题

09-03

在Java中，读取和写入文件时遇到的乱码问题通常源于编码格式不匹配。文件可能使用了特定的字符编码（例如UTF-8、GBK等），而Java程序在处理这些文件时没有正确识别或指定这个编码，从而导致乱码。解决这个问题的关键...

java 读取文件乱码

04-06

了解了这些基础知识后，我们就能有效地处理Java读取文件时可能出现的乱码问题。在编写代码时，始终注意文件编码的设定，尤其是在处理跨平台或多语言内容时，使用Unicode（如UTF-8）作为标准编码通常是个好选择。通过...

java unicode中文乱码_java中文乱码解决之道（三）-编码详情：伟大的创想-Unicode编码 - Java 技术驿站-Java 技术驿站...

weixin_42515301的博客

02-16

344

随着计算机的发展、普及，世界各国为了适应本国的语言和字符都会自己设计一套自己的编码风格，正是由于这种乱，导致存在很多种编码方式，以至于同一个二进制数字可能会被解释成不同的符号。为了解决这种不兼容的问题，伟大的创想Unicode编码应时而生！！UnicodeUnicode又称为统一码、万国码、单一码，它是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一并且唯一的二进制编码...

java unicode中文乱码_java中文乱码解决之道（一）-----认识字符集

weixin_42356307的博客

02-12

895

沉寂了许久(大概有三个多月了吧)，LZ“按捺不住”开始写博了！java编码中的中文问题是一个老生常谈的问题了，每次遇到中文乱码LZ要么是按照以前的经验修改，要么则是baidu.com来解决问题。阅读许多关于中文乱码的解决办法的博文后，发现对于该问题我们都(更加包括我自己)没有一个清晰明了的认识，于是LZ想通过这系列博文(估计只有几篇)来彻底分析、解决java中文乱码问题，如有错误之处望各位同仁指出...

Java读取properties配置文件时，中文乱码解决方法

weixin_30576827的博客

11-06

206

碰到了用java.util.Properties读取中文内容（UTF-8格式）的配置文件，发生中文乱码的现象 Properties prop=new Properties(); prop.load(Client.class.getClassLoader().getResourceAsStream("config.properties")); 由于使用...

java unicode中文乱码_java中文乱码解决之道（三）-----编码详情：伟大的创想---Unicode编码...

weixin_39635130的博客

02-12

354

Java读取文件出现乱码的解决

06-12

1104

今天竟然也遇到这种事了，记事本默认编码是ANSI，读取的时候数字读取

Java处理txt文件遇到的问题（unicode编码）

sweetyi的专栏

01-14

2423

1. 今天处理从excel导出的unicode编码格式文件，结果发现有很多乱码，unicode格式文件内容和程序处理结果如下： import java.io.*; public class Filetest { public static void main(String[] args) throws IOException{

JAVA 读取文件出现乱码的解决方案

Beaver‘s

02-25

836

今天在解析一个文本文件的时候出现了乱码，以前从未遇到，花了点时间上网解决了，在此总结一下：首先，先看一下解析的代码： [code="java"]public List readLog(String logName){ List picName = new ArrayList(); String fileName = "D:\\"+logName; Buffere...

java文件读取乱码_java 读取文件乱码

weixin_39603799的博客

02-20

294

private void filereader() throws IOException{BufferedReader bf= new BufferedReader(new InputStreamReader(new FileInputStream("D:\\CompareDll.py"),"UTF-8"));String str="";while((str=bf.readLine())!=nul...

java中文乱码处理

风轻云淡，笑看人生得失！

01-06

490

在基于Java的编程中，经常会碰到汉字的处里及显示的问题，比如一大堆乱码或问号。这是因为JAVA中默认的编码方式是UNICODE，而中国人通常使用的文件和DB都是基于GB2312或者BIG5等编码，故会出现此问题。 1、在网页中输出中文。 JAVA在网络传输中使用的编码是"ISO-8859-1"，故在输出时需要进行转化，如： String str