vs下二进制读取文本文件到buffer中结尾出现乱码的解决

最新推荐文章于 2024-12-16 01:00:29 发布

原创最新推荐文章于 2024-12-16 01:00:29 发布 · 1.2k 阅读

0 ·

CC 4.0 BY-SA版权

cpp学习专栏收录该内容

1 篇文章

订阅专栏

本文介绍了一个使用C++进行文件读取时遇到的乱码问题及其解决方案。通过对文件大小的正确处理和字符串结尾符的添加，解决了读取文件时出现的乱码现象。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

#include <iostream>
#include <fstream>
#include <string>

using namespace std;

int main(){
	ifstream fileIn;
	char* buff;
	long size;
	fileIn.open("testIO.cpp",ios::binary|ios::in|ios::ate|ios::_Nocreate);
	if(!fileIn){
		cout << "open file err" << endl;
		system("pause");
		return  -1;
	}
	size = fileIn.tellg();
	buff = new char[size];
	fileIn.seekg(0,ios::beg);
	fileIn.read(buff,size);
	cout << buff << endl;
	fileIn.close();
	system("pause");
}

这段代码输出的buff末尾总会有几个乱码

原因是读取的时候size并无讲结尾符读进来

所以认为到了size后面的地方任然是字符串

解决方式就是手动添加结尾

...
  buff = new char[size + 1];
  fileIn.seekg(0,ios::beg);
  fileIn.read(buff,size);
  buff[size] = '\0';
...

感谢各位指正

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

MapzChen

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Qt基础之三十五：Qt中文乱码探索

草上爬的博客

04-07

7293

Qt中文乱码看这一篇就够了先说个小技巧：Qt Creator支持显示源文件编码格式右上角点UTF-8，会弹出“文件编码”对话框我的开发环境是Win10 Qt5.12.6 VS2017，IDE是Qt Creator。

c语言读取程序内容,C语言详解——文件读取

weixin_39619481的博客

05-17

4148

1. 需要了解的概念需要理解的知识点包括：数据流、缓冲区、文件类型、文件存取方式1.1 数据流：指程序与数据的交互是以流的形式进行的。进行C语言文件的存取时，都会先进行“打开文件”操作，这个操作就是在打开数据流，而“关闭文件”操作就是关闭数据流。1.2 缓冲区(Buffer)：指在程序执行时，所提供的额外内存，可用来暂时存放做准备执行的数据。它的设置是为了提高存取效率，因为内存的存取速度比磁盘驱动...

参与评论您还未登录，请先登录后发表或查看评论

VC.NET读写二进制大文件.rar

07-10

VC.NET读写二进制大文件的范例源代码，采用流技术读写大文件，使用System.IO命名空间下的FileStream文件流类，实现对二进制大对象轻松进行读写。这是一个用VS2005编写的WinForm程序，通过打开一个bmp或者jpg大文件，让其显示在图形控件PictureBox中。通过“Save”按钮存入数据库。点击“View”CheckBox可以切换到浏览状态，观看存入数据库的图片。对二进制大对象使用的流操作，对于任何文件都具有通用性，读写文本文件也可以这么做。

二进制文件 .VS. 文本文件 ＞ python

一些笔记

12-14

529

【前言】最近用python读二进制文件，遇到一个问题：我的二进制文件里面掺杂着正常的文本，我想将里面的文本给剔除掉。解决这个问题就是写这篇文章的初衷。一、预备知识 二进制文件和文本文件有啥区别呢？百度知道里面有位大佬说：在定义和存取方式上二进制文件与文本文件存在区别。 1、定义上的区别 文本文件：文本文件是一种计算机文件，它是一种典型的顺序文件，其文件的逻辑结构又属于流式文件。简单的说，文本文件是基于字符编码的文件，常见的编码有ASCII编码，UNICODE编码等等。 二进制文件：是基于值编

VS2013C/C++方式读写二进制文件

weixin_45719702的博客

04-29

1678

//写文件 FILE *file; fopen_s(&file, "C:/Users/liu/Desktop/test.dat", "wb+"); int pchar[2] = { 10,20 }; fwrite(pchar, sizeof(int), 2, file); fclose(file); //读文件 int recvchar[20]; FILE *file1; ...

由于很需要转来--------二进制字符流读取，判定单字节英文标点字符和双字节中文---防止乱码

xin15200793067的专栏

10-20

1519

GBK为双字节编码，但是他向下兼容gb2312，也就是说英文标点符号、字母、数字都是用一个字节标示。我现在有这样的需求：我需要读取一个被加密的文本文件。现在有两个限制，第一我不能一次读取整个文本，因为文本很大，手机不能承受。第二，因为这个文件加密是对每个字节做的处理，所以我必须先用字节流读取这个文件并解密在转换成字符。我第一次用字节流读取一段内容时，最后一个字节可能是一个中

vs2017读取txt文件总结，可以存放二进制文件，txt一行一行存取

XHL_优快云_DOW的博客

03-24

2672

1.可以存放二进制的存放的是：name.txt存放中文名称，facedata.txt存放二进制文件， copyfeature1.feature是一个unsinged char类型的数组的名称。 //存放数据 char name[10] = { 0 }; cout << "姓名："; cin >> name; cout << endl; FILE * ...

基于存储的C语言文件操作常规问题分析（文本文件与二进制文件）

qq_40996392的博客

05-13

567

基于存储的C语言文件操作常规问题分析（文本文件与二进制文件）问题描述文本文件与二进制文件数据写入文本乱码问题fopen和open流式文件操作常用函数直接I/O文件操作常用函数问题描述我们都知道计算机中的数据都是以二进制存储的，也对不同的编码解码有所了解，比如ASCII、UNICODE、UTF-8编码等。但当使用C语言对文件进行读写，会遇到了各种各样的问题，比如从文件中读取到的数据不是我们想要的数据，向文件中写入数据变成乱码，对C语言读写文件的各种参数不甚了解，读写位置与各种符号不好判断等问题。在程序编

数字电子技术基础（四）——用二进制来表示数字、文本、图像的方法

qq_54186956的博客

12-16

1597

本文主要介绍用二进制来表示数字，用二进制来表示文本，其中文本包括ASCII码的发展历史，GBK编码的发展历史，Unicode编码的介绍，并且还介绍了使用二进制来表示图片

C语言字符编码转换详解：文本到二进制的关键步骤

针对编码转换中可能出现的文本乱码问题和大小端字节序影响，本文提出了解决方案。最后，通过网络数据交换和跨平台软件编码应用的实际案例，展示了字符编码转换的实际应用和最佳实践。 # 关键字字符编码；C语言；...

C# 向二进制文件进行读写

07-24

C# 二进制 BinaryReader BinaryWriter C# 二进制 BinaryReader BinaryWriter C# 二进制 BinaryReader BinaryWriter

VS Code二进制查阅插件Hex Editor(附ASCII表)

微小冷的学习笔记

11-14

4855

Hex Editor是一款强大的二进制读取插件，安装之后，可以直接把二进制文件拖入VS Code，然后点击`仍然打开`按钮，选择`Hex Editor`，就可以看到二进制数据了.

关于vs.net中读取文件出现乱码的现象

weixin_30670151的博客

04-05

110

最近有些朋友总是发现读取文件的时候发现乱码，不过用工具打开一看却是好的。其实这个问题的罪魁祸首是VS.net的编辑器，在MS下一般文件编辑器（Notepad，ultraedit)都是使用操作系统缺省编码（不同的系统会不同），如在我的英文xp是ANSI，vs.net新建文件的保存以后使用的编码却是UTF8，大概是为了和StreamReader和StreamWriter打开文件缺省得encodin...

文件练习：实现把一个有学号、姓名、年龄、C成绩的结构体变量写入到二进制文件中去的代码。（结构体变量键盘输入）

weixin_47919250的博客

09-02

352

//实现把一个有学号、姓名、年龄、C成绩的结构体变量写入到二进制文件中去的代码。（结构体变量键盘输入） #include <stdio.h> #include <conio.h> #include <stdlib.h> struct stu { char name[10]; int num; int age; char addr[15]; }a[1],*pp; int main() { FILE *fp; char ch;.

VS2008, MFC 文件的操作1 - C语言方式文本方式打开 / 二进制方式打开读写 C

DZWH的博客

06-25

691

1. 在菜单栏新建子菜单File 和菜单项 WriteFile，ReadFlile,并都添加事件处理函数到工程view类中。 2. 以文本新式打开读写文件代码 void Cvs2008_SX_jiaocheng12View::OnFileWritefile() { // TODO: 在此添加命令处理程序代码 //C语言方式 FILE *pFile = fopen("1.txt","w");//Opens an empty file for writing. If the give

字节流VS缓冲流

weixin_30872789的博客

08-25

114

---恢复内容开始--- 字节流VS缓冲流 java.io包中的类大致可以分为：InputStream、OutputStream、Reader、Writer。InputStream/Reader可以理解为input from数据源，OutputStream/Writer可以理解为output to数据目的地。他们的前者处理的是字节，后者处理的是字符。而数据源则可能是来自硬盘上的文件、内存中的变...

利用Visual Studio以二进制方式打开文件

最新发布

03-14

<think>好的，我现在需要解决用户提到的char数组无结尾符转QString出现乱码的问题。首先，我要回忆一下相关的知识，并逐步分析可能的原因和解决方案。用户的问题是将没有终止符的char数组转换为QString时出现乱码。首先，我需要确认char数组和QString之间的转换机制。通常，QString的fromLocal8Bit或fromUtf8等方法会依赖于正确的数据长度或终止符来确定字符串的结束位置。如果char数组没有正确的终止符'\0'，那么这些方法可能会读取超出数组实际内容的内存，导致乱码。接下来，我应该考虑用户的使用场景。用户可能有一个固定长度的char数组，例如从某些硬件设备读取的数据，或者通过某种协议接收的数据，这些数据可能不以'\0'结尾。如果直接使用QString的构造函数或转换函数，而没有指定长度，就会导致问题。可能的解决方案包括：明确指定转换的长度，或者在转换前手动添加终止符。但手动添加终止符需要注意数组的长度是否足够，否则可能引发缓冲区溢出。更安全的方式是在转换时指定长度，这样QString会根据指定的字节数进行转换，不会依赖终止符。另外，编码问题也是一个常见的原因。比如，char数组中的数据是使用本地编码（如GBK）还是UTF-8。如果编码不匹配，即使正确指定了长度，仍然会出现乱码。因此，用户需要确认char数组的实际编码，并选择对应的QString转换函数，如fromLocal8Bit或fromUtf8。还需要考虑数据中是否包含非文本的二进制数据。如果char数组包含二进制数据而非字符串，转换为QString本身就不合适，应该使用QByteArray来处理。总结可能的解决步骤： 1. 确定char数组的实际长度，并在转换时明确指定该长度。 2. 确认数据的编码格式，使用对应的转换函数。 3. 如果数据是二进制，避免转换为QString。 4. 如果必须添加终止符，确保数组有足够的空间，并谨慎操作。在验证时，用户可以通过打印转换后的QString或使用调试工具检查结果。同时，测试不同编码和长度的情况，确保解决方案的鲁棒性。现在，我需要将这些思考整理成结构化的步骤，帮助用户逐步解决问题，并注意使用正确的中文术语和清晰的解释。</think>### 解决 char[] 无结尾符转 QString 乱码问题的分步指南 #### 问题本质当 `char[]` 未显式包含终止符 `\0` 时，`QString` 的转换函数无法自动检测有效数据长度，导致读取越界内存（脏数据）或编码不匹配，最终产生乱码。 --- #### 步骤 1：确认数据长度 **核心原则**：必须明确指定有效数据长度 - 假设 `char[]` 实际有效数据长度为 `N`，转换时应显式声明该长度： ```cpp char rawData[100] = { ... }; // 假设有效数据长度为50字节 QString str = QString::fromLocal8Bit(rawData, 50); // 明确指定长度 ``` --- #### 步骤 2：匹配编码格式 **关键操作**：根据数据来源选择正确的编码转换函数 1. **UTF-8 编码**： ```cpp QString str = QString::fromUtf8(rawData, N); ``` 2. **系统本地编码**（如 Windows 的 GBK）： ```cpp QString str = QString::fromLocal8Bit(rawData, N); ``` 3. **Latin-1 编码**： ```cpp QString str = QString::fromLatin1(rawData, N); ``` --- #### 步骤 3：处理二进制数据（非字符串） **注意事项**：如果 `char[]` 存储的是二进制数据（如图片、序列化对象），禁止直接转字符串 - 应使用 `QByteArray` 封装： ```cpp QByteArray byteArray = QByteArray::fromRawData(rawData, N); // 后续通过二进制方式处理 ``` --- #### 步骤 4：安全补终止符（可选） **风险提示**：修改原数组可能导致溢出，仅限可控场景 ```cpp char buffer[1024]; memcpy(buffer, srcData, srcLength); // 复制原始数据 buffer[srcLength] = '\0'; // 手动补终止符（确保 buffer 长度 > srcLength） QString str = QString::fromLocal8Bit(buffer); ``` --- #### 验证方法 1. **输出调试信息**： ```cpp qDebug() << "Result:" << str; ``` 2. **检查长度**： ```cpp qDebug() << "String length:" << str.length(); ``` 3. **十六进制比对**： ```cpp QByteArray verify = str.toLocal8Bit(); qDebug() << verify.toHex(); ``` --- #### 完整示例代码 ```cpp // 场景：从串口读取20字节无终止符的GBK编码数据 char serialData[20]; readFromSerialPort(serialData, 20); // 伪代码，实际读取数据 // 安全转换 QString result = QString::fromLocal8Bit(serialData, 20); // 验证结果 if(result.isEmpty()) { qWarning() << "转换失败，请检查编码或数据有效性"; } else { qDebug() << "转换结果:" << result; } ``` --- #### 常见错误排查表 | 现象 | 可能原因 | 解决方案 | |--------------------|-------------------------|----------------------------| | 尾部出现随机汉字 | 未指定长度导致读取越界 | 显式声明有效数据长度 | | 全部是乱码 | 编码不匹配 | 切换 `fromUtf8`/`fromLocal8Bit` | | 半截字符串 | 数据中包含意外终止符 `\0` | 检查数据来源，清理无效字符 | | 转换后字符串为空 | 数据全为0或无效编码 | 验证原始数据合法性 | 通过上述步骤，可系统性解决无终止符 `char[]` 转 `QString` 的乱码问题。