读取二进制文件的中文乱码问题

最新推荐文章于 2025-09-09 09:37:49 发布

原创最新推荐文章于 2025-09-09 09:37:49 发布 · 1.2w 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#乱码 #windows #linux #编码

java编程基础专栏收录该内容

5 篇文章

订阅专栏

本文详细阐述了在将Linux环境下开发的项目转移到Windows环境时，遇到中文乱码问题的原因及解决方案。重点在于理解DataInputStream的readByte()方法在读取二进制文件时未指定编码可能导致的问题，并提供了通过指定具体编码方式来解决此问题的方法。

问题描述：

在linux下开发的项目，转移到windows环境，运行后，发现出现中文乱码。

追根溯源：

逐步debug，发现并非在网络传输过程中出现乱码问题（若是，可通过对request、response设置编码，setCharacterEncoding("utf-8")解决），而是在读取二进制文件时，未指定编码的原因。

项目中使用了DataInputStream的readByte()方法，按字节读取文件，然后将byte[]其转为String。转换方式：new String(bytes,0, size)，因为没有指定编码，可能出现乱码问题。

解决方案：

通过new String(bytes,0, size, "utf-8")，指定具体的编码方式，如这里的"utf-8"。

此外，使用String的另一构造函数：public String(bytebytes[], Charset charset)，可实现强制转码：

String str = new String（str.getByte("iso8859-1"),"UTF-8"）。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

水灵动

关注关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Qt 二进制文件的读写

yishuihanq的博客

10-24

1061

Qt 二进制文件的读写

【控件功能】我来做练习-第7课-二进制文件如何读取和保存呢

大龙软件工作室

05-03

958

二进制文件的读写用流

参与评论您还未登录，请先登录后发表或查看评论

文件下载，二进制流转换成文件解决中文名乱码的问题

01-17

文件下载，二进制流转换成文件解决中文名乱码的问题

为什么二进制文件内容是乱码

Xsbugh的博客

01-03

3616

不知道大家有没有一个经验，就是忍不住好奇想打开二进制文件（就是 .exe, .gif, .docx, .xlsb… 等一系列不是明文 plaintext 的文件）一探究竟。结果打开一看都是乱码。那么这篇文章将会满足你的好奇心，并附上正确开启方式哦！本文参考资料来自 Stack Overflow 帖子的高赞回答。如有错误，请发送您的观点到我的邮箱中，我会对文章进行更新。当然，我还通过 ChatGPT 去了解相关资料，以下是对话内容（仅供参考）。

字节码（.class）

最新发布

qq_41019389的博客

09-09

580

Java字节码是Java源码编译后生成的中间二进制指令（.class文件），由JVM执行。其核心优势是实现跨平台性，支持"一次编写，到处运行"，使Java程序能在不同操作系统上运行而无需重新编译。此外，字节码还提供安全性校验、性能优化空间（通过JIT编译）以及语言无关性（支持多种JVM语言）。这种设计使Java成为安全、高效且跨平台的编程语言。

linux二进制显示乱码解决方法

beisongxia1100的博客

07-23

1393

针对与不小心看了二进制文件后bash显示乱码的问题，如果是文件中出现乱码则需要调整语言字符集或者终端的语言字符集[root@master nagios]# env|grep LANGLANG=zh_CN.UTF-8[root@master nagios]# 在linux中cat二进制文件出现乱码的解决方法:1.按键盘ctrl+v后再按ctrl+o,回车（注意：需要先使用set -o vi这条命令，...

linux用cat查看二进制文件出现乱码

happy_hound的博客

05-13

1269

如果说在查看文件之前我们不确定文件格式，可以使用 file -i查看文件的编码格式。这个命令会输出文件的相关信息，包括编码格式。在bash下用cat显示二进制文件后就会出现乱码，并且整个终端显示包括shell提示符都是乱码，这个跟语言环境无关。hexdump 是一个用于查看二进制文件的命令，可以将二进制文件转换为十六进制格式并打印出来。与这个命令相对的是echo -e '\xe'，在正常状态下输入此命令会把终端搞出乱码来。2、使用 od 命令（od 命令与 hexdump 类似，但提供了更多的格式选项）

使用ultraedit打开二进制文件后，不是通常的显示成16进制，而是显示乱码

qq_43248127的博客

02-22

2683

当文件长度过小时，比如小于4k时，会出现改问题。

JavaScript读二进制文件并用ajax传输二进制流的方法

10-21

以下是一份详细的指南，涵盖了如何在JavaScript中读取二进制文件以及使用Ajax传输二进制流。首先，HTML部分通常会包含一个文件输入元素，允许用户选择要上传的文件。例如： ```html ;margin-left: 20px;margin-...

C/C++ 读取16进制文件的方法

08-31

由于文本文件通常是以字符编码（如ASCII或UTF-8）存储的，直接读取可能会导致乱码问题。为了解决这个问题，我们可以将文件内容视为16进制值，从而避免字符编码的困扰。本文将介绍如何在C/C++中读取16进制文件。 ...

mysql character_set_client 设置_关于mysql字符集设置了character_set_client=binary 在gbk情况下会出现表描述是乱码的情况...

weixin_32202001的博客

01-19

750

mysql链接建立之后，通过如下方式设置编码：mysql_query("SET character_set_connection=" . $GLOBALS['charset'] . ",character_set_results=" . $GLOBALS['charset'] . ",character_set_client=binary", $this->link);然而建立出来的表结构描...

cat二进制文件导致界面乱码的问题解决

反手一个bug的博客

01-20

3018

学习Linux的时候用cat打开bin目录下的cat指令文件，然后界面乱码了，如下图：然后用reset指令重置以后恢复正常用od命令查看二进制文件就没问题了以后要记得用od命令去查看二进制文件 ...

ultraedit 读取二进制数据乱码_吐血的二进制文件操作

weixin_39673293的博客

12-04

2159

这两天的吐血操作，真是傻叉到极致的感觉。唉！事情是这样的，就是对现有的雷达数据，按照协议进行读取，然后生成对应的点云模型。但是我真的是属于比较笨的类型，对于二进制文件死活理解不开。嗯，没错，这就是二进制文件(binary)。看着这些乱码，我简直要炸。硬是活活折腾了快三天，我简直就是个假程序员。网上都说这个观点，这个比txt，ascii文件简单。这简直激发了我不服输...

Git Base 中文显示乱码问题

qq_42389598的博客

04-17

1436

Git base 中文显示乱码问题Git Base 中文显示乱码 Git Base 中文显示乱码今天做一个实验的时候要用到Git运行Java的打包文件，但是输出有中文，导致显示乱码，如下：百度找了一下，直接右键，选择Options…——>Text——>Locale里面选择zh_CN,Character set选择UTF-8，但是关闭再打开运行还是乱码，遂检查Java文件的编码方...

关于结构体里面的字符串指针输出出现乱码的问题与结构体数组作为参数传值的问题

二杠青年

10-29

9146

首先，结构体里面的字符串指针输出出现乱码的问题：相信很多遇到过这种问题的人都跟我一样写过这样的代码（好吧，或许不一样。。。）： #include #include typedef struct{ int age; const char* name; const char* id; }person; person p(); int main(){ person s[1]; s[0]=

c# 存取结构体 二进制文件 中文乱码

anqiaoej627921的博客

03-19

575

对于C#结构体包含中文和c程序交互时乱码的问题，应该在C#的结构体定义时指定字符集代码////摘要://用于在结构中出现的内联定长字符数组。与System.Runtime.InteropServices.UnmanagedType.ByValTStr//一起使用的字符类型由应用于包含结构的System.Runti...

中文输出乱码

m0_74217128的博客

09-08

295

计算机中的数据都是以二进制形式存储的，当传输文本时，就会发生字符和字节之间的转换。字符转换为字节的过程叫编码，字节转换成字符的过程叫解码，这两种都要要使用到码表。常见的码表有ASCLL、UTF-8等。例如，Response使用的码表为 ISO-8859-1。一些码表。

vue中由 window.open转为二进制流下载遇到下载之后无法打开或乱码的坑 (responseType: ‘blob‘ 无效)

m0_58293192的博客

06-25

1687

vue中由 window.open转为二进制流下载遇到下载之后无法打开或乱码的坑 (responseType: 'blob' 无效)

gin文件下载中文乱码解决

22333

05-01

1519

engine := gin.Default() engine.GET("/up", func(c *gin.Context) { c.Header("Content-Type", "application/octet-stream") c.Header("Content-Disposition", fmt.Sprintf("attachment; filename*=utf-8''%s", url.QueryEscape("哈哈.png"))) file, err := ioutil.ReadFile

记事本读取二进制文件乱码

08-31

记事本读取二进制文件出现乱码的原因是因为记事本只能识别字符类型，无法正确解码二进制文件中的其他类型。当我们使用记事本打开二进制文件时，由于记事本按照既定的字符编码工作（如ASCII码），无法正确识别二进制文件的编码方式，导致文件内容显示为乱码。这是因为二进制文件中的数据被解释成了控制符或其他无法识别的字符。因此，记事本并不适合用来打开和读取二进制文件。如果需要正确解码和读取二进制文件，我们通常需要使用专门的二进制文件编辑器或编程语言来进行处理。123 #### 引用[.reference_title] - *1* *3* [文本文件和二进制文件，能用记事本打开的就是文本文件，不能用记事本打开的就是二进制文件](https://blog.youkuaiyun.com/m0_67394615/article/details/124092440)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [python 读取二进制显示图片案例](https://blog.youkuaiyun.com/weixin_39600885/article/details/109971073)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]