使用标准C读取文件遇到的结构体对齐问题及其解决办法

本文探讨了使用标准C库读取文件时遇到的问题,特别是因结构体内存对齐导致的数据读取错误,并提供了解决方案,包括使用逐个基本类型读取和修改结构体定义以确保正确的内存对齐。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

作者:朱金灿

来源:http://blog.youkuaiyun.com/clever101

 

         同事使用标准C库读取文件,发现总是读取不对,让我帮忙看一下。

原来他定义了如下一个结构体:

// 定义块的结构
typedef struct {
    unsigned short        id;
    long                len;
} Chunk3DS; 

       然后这样读取文件:

       if (fread(&chunk,sizeof(Chunk3DS),1,m_fp)!=1)
        {
            return FALSE;
        }

但是读取的内容总是不对。

 

        我想到结构体内存对齐这档子事,于是我把读取代码改为:

Chunk3DS chunk;
if (fread(&chunk.id,sizeof(unsigned short),1,m_fp)!=1)
        {
            return FALSE;
        }
if (fread(&chunk.len,sizeof(long),1,m_fp)!=1)
        {
            return FALSE;
        }

      接着我测试了一下:

int nShortSize = sizeof(unsigned short); // 等于2
int nLongSize  = sizeof(long); // 等于4
int SstructSize = sizeof(Chunk3DS); // 等于8

       整整差了两个字节,难怪读取的内容不对。现在我发现由于结构体内存对齐的缘故(结构体内存对齐的原理网上的相关文章很多,在这不进行详述),使用fread接口去读一个结构体的缓冲区常常不准确,其实也不科学,因为文件设计者在设计文件时文件的各个成员肯定都是紧挨着的,因此是使用简单类型逐个去读取。

 

       如何解决这个问题呢?如前文所述,使用简单类型逐个去读取肯定是可以的,但是如果文件比较复杂的话,这意味着要写比较多的代码。有没有更好的办法呢?也有,可以将结构体做如下定义:

/* 对齐结构成员到1字节 */
#ifdef __GNUC__
    #define GNUC_PACKED __attribute__((packed))
#else
    #define GNUC_PACKED
#endif
 
#ifdef __arm 
    #define ARM_PACKED  __packed 
#else 
    #define ARM_PACKED 
#endif
 
#if defined(WIN32) || defined(_WIN64)
    #pragma pack(1)
#endif
ARM_PACKED
typedef struct {
    unsigned short id;
    long len;
}GNUC_PACKED Chunk3DS;
#if defined(WIN32) || defined(_WIN64)
    #pragma pack()
#endif


参考文献:

 

1.  【原创&交流】使用标准C库读文件时需要注意的一个问题

### 回答1: C语言标准中关于结构体对齐的定义,可以用以下中文来解释: 结构体成员的对齐方式是指,为了使结构体的访问效率最高,编译器将结构体成员按照特定规则分配到内存中的位置。在分配时,编译器会将结构体成员的大小和相对位置考虑在内,以保证成员的对齐。这样可以避免在访问结构体成员时出现性能上的问题。 具体来说,C语言标准规定了以下几个对齐原则: 1. 结构体的首地址必须是其最宽基本类型成员的首地址; 2. 每个成员相对于结构体首地址的偏移量必须是该成员大小的整数倍; 3. 结构体的总大小必须是最宽基本类型成员大小的整数倍。 根据这些原则,编译器会在结构体成员之间插入填充字节,以保证成员的对齐。这样可以提高CPU读取内存的效率,减少内存访问次数和数据传输量,从而提高程序的性能。 ### 回答2: C语言标准中关于结构体对齐的定义主要包含以下几点。 首先,结构体对齐是为了保证结构体的成员在内存中的存储位置符合一定的规则,以提高计算机的访问效率。 其次,对于一个结构体变量,其起始地址必须是所有基本类型成员中的首字节地址,而非基本类型成员的起始地址可以是任意的。 接着,结构体对齐要求由编译器根据具体实现来决定,可能受到硬件和操作系统的限制。 另外,编译器通常会在结构体的成员之间添加填充字节,以满足对齐要求。填充字节的数量取决于结构体成员的类型和前一个成员结束地址与对齐边界的差值。 最后,使用特定的编译指示(如#pragma pack(n))可以改变默认的对齐方式。这样做可能会降低对齐的效果,但可以满足某些特殊需求。 总结来说,C语言标准中关于结构体对齐的定义规定了结构体成员在内存中的存储方式。对齐规则由编译器根据实际情况来决定,并可通过编译指示进行修改。结构体对齐的目的在于提高计算机的访问效率,确保结构体成员存储位置的正确性。 ### 回答3: C语言标准中关于结构体对齐的定义主要有两个方面,分别是默认对齐方式和自定义对齐方式。 首先是默认对齐方式,默认情况下,结构体对齐方式要求结构体的每个成员的地址都能够被结构体中最宽基本类型的大小整除,也就是说,结构体对齐大小必须是其成员中最宽数据类型的大小或其整数倍。如果结构体中的成员包含指针类型或者更宽的基本类型,那么该结构体的大小会被这些类型的大小所影响。 其次是自定义对齐方式,在C语言标准中,可以通过在结构体定义前使用特定的编译器指令(如`#pragma pack`)来自定义结构体对齐方式。通过设置对齐方式,可以控制结构体成员的对齐间距。例如,可以使用`#pragma pack(n)`来指定结构体对齐方式为n字节。这种自定义对齐方式可以用于优化内存布局,减小内存开销。 总的来说,C语言标准结构体对齐的定义要求保证结构体的成员能够按照其类型在内存中正确对齐,同时允许使用自定义对齐方式以满足特定需求。对结构体对齐的规定有助于确保内存的有效利用和提高程序执行效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

clever101

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值