C位域知识小结

位域的用途:

       有些信息在存储时,并不需要占用一个完整的字节, 而只需占几个或一个二进制位。例如在存放一个开关量时,只有0和1 两种状态, 用一位二进位即可。为了节省存储空间,并使处理简便,C语言又提供了一种数据结构,称为“位域”或“位段”。所谓“位域”是把一个字节中的二进位划分为几个不同的区域,并说明每个区域的位数。每个域有一个域名,允许在程序中按域名进行操作。 这样就可以把几 个不同的对象用一个字节的二进制位域来表示。 

1. 一个位域必须存储在同一个字节中,不能跨两个字节,故位域的长度不能大于一个字节的长度。

如一个字节所剩空间不够存放另一位域时,应从下一单元起存放该位域。也可以有意使某位域从下一单元开始。例如:

#include <iostream>

using namespace std;

struct BitField1
{
    unsigned int a:4;  //占用4个二进制位;
    unsigned int  :0;  //空位域,自动置0;
    unsigned int b:4;  //占用4个二进制位,从下一个存储单元开始存放;
    unsigned int c:4;  //占用4个二进制位;
    unsigned int d:5;  //占用5个二进制位,剩余的3个bit不够存储4个bit的数据,从下一个存储单元开始存放;
    unsigned int  :0;  //空位域,自动置0;
    unsigned int e:4;  //占用4个二进制位,从这个存储单元开始存放;
};
int main()
{
    BitField1 bitfiled1;
    printf("sizeof(BitField) = %d\n",sizeof(bitfiled1));
    return 0;
}

运行结果:


2. 取地址操作符&不能应用在位域字段上;

3. 位域字段不能是类的静态成员;

4. 位域字段在内存中的位置是按照从低位向高位的顺序放置的;

#include <iostream>

using namespace std;

struct BitField
{
    unsigned char a:2;  //最低位;
    unsigned char b:3;
    unsigned char c:3;  //最高位;
};
union Union
{
    struct BitField bf;
    unsigned int n;
};

int main()
{
    union Union ubf;
    ubf.n = 0;    //初始化;
    ubf.bf.a = 0; //二进制为: 000
    ubf.bf.b = 0; //二进制为: 000
    ubf.bf.c = 1; //二进制为: 001

    printf("sizeof(BitField) = %d\n",sizeof(BitField));
    printf("ubf.bf.n = %u\n", ubf.n);
    printf("ubf.bf.a = %d, ubf.bf.b = %d, ubf.bf.c = %d\n", ubf.bf.a, ubf.bf.b, ubf.bf.c);
    return 0;
}

运行结果:

位域中的位域字段按照从低位向高位顺序方式的顺序来看,那么,a、b、c这三个位域字段在内存中的放置情况是:

最高位是c:001,中间位是b:000,最低位是a:000;所以,这个位域结构中的8二进制内容就是: 00100000,总共8个位,其十进制格式就是32;

实际上打印出来的ubf.n值就是32;关于union的介绍请参考:点击打开链接

5. 位域的对齐

1. 如果相邻位域字段的类型相同,且其位宽之和小于类型的sizeof大小,则后面的字段将紧邻前一个字段存储,直到不能容纳为止;

2. 如果相邻位域字段的类型相同,但其位宽之和大于类型的sizeof大小,则后面的字段将从新的存储单元开始,其偏移量为其类型大小的整数倍;

3.如果相邻的两个位域字段的类型不同,则各个编译器的具体实现有差异,VC6采取不压缩方式,GCC和Dev-C++都采用压缩方式;

4. 整个结构体的总大小为最宽基本类型成员大小的整数倍。

5. 如果位域字段之间穿插着非位域字段,则不进行压缩;(不针对所有的编译器)


#include <iostream>

using namespace std;

struct BFA
{
    unsigned char a:2;
    unsigned char b:3;
    unsigned char c:3;
};
struct BFB
{
    unsigned char a:2;
    unsigned char b:3;
    unsigned char c:3;
    unsigned int  d:4;  //多出来这个位域字段;
    unsigned char e:2;
    unsigned char f:3;
    unsigned char g:3;
};
int main()
{    
    BFA bfa;
    BFB bfb;
    cout<<"sizeof(bfa) = "<<sizeof(bfa)<<"\tsizeof(bfb) = "<<sizeof(bfb)<<endl;
    return 0;
}

运行结果:


如果搞不清楚sizeof的结果,建议打个断点看内存分配。欢迎讨论交流。

### C语言的使用方法和特性 #### 定义与声明 在C语言中,是一种特殊的结构体成员,允许程序员指定每个成员占用多少个二进制。这有助于更高效地管理内存资源并精确控制数据表示方式[^1]。 ```c struct bit_field { unsigned int flag : 1; // 占用1 unsigned int value : 7; // 占用7 }; ``` 上述代码片段展示了如何在一个`unsigned int`类型下分配不同的宽度给各个字段。值得注意的是,在某些情况下,编译器可能会根据目标平台的要求自动调整这些置或排列顺序[^4]。 #### 访问成员 一旦定义好带有的结构体之后,就可以像处理常规结构体那样对其进行初始化、读取或者修改其中的数据了: ```c struct bit_field example; example.flag = 1; // 设置标志为真 (即 '1') example.value = 59; // 给value赋值不超过其最大范围内的数值 printf("Flag=%u Value=%u\n", example.flag, example.value); ``` 这段程序说明了怎样创建一个名为 `bit_field` 的实例,并对其内部两个进行了简单操作。由于本质上还是属于某个基本数据类型的子集,因此对于可接受的最大最小值存在限制[^3]。 #### 编译器行为差异 当涉及到不同类型之间组合而成的复杂情况时,不同版本甚至同一款编译工具链也可能表现出不一致的行为模式。比如下面的例子就显示了一个混合字符型(`char`)和整形(`int`)作为基础类型的集合: ```c #include <stdio.h> struct mixed_bits { char a : 2; // 字符串中的两 char b : 3; // 另外三个比特来自同一个字节 int c : 1; // 整形的一跨越到下一个机器字边界上去了... }; int main() { printf("Size of struct mixed_bits is %lu bytes.\n", sizeof(struct mixed_bits)); } ``` 此段代码打印出来的结果会因具体环境而异,因为标准并没有明确规定跨过多个底层单的情况应该如何处理。所以在设计涉及多类型的应用之前应当充分考虑这一点[^2]。 #### 特殊情况下的无名 除了命名好的之外,还可以设置一些未被指派名字的空间来充当间隔作用或是为了满足特定硬件需求所必需留白的地方。这类匿名条目不会参与任何实际运算过程,仅起到占效果而已: ```c struct padding_example { short data : 8; // 实际有用的八信息 short : 6; // 这里预留六个空闲不做他用 short more_data : 2; // 接下来的两置放其他东西 }; ``` 这种做法有时可以帮助开发者更好地匹配外部接口规格或者是优化存储布局以提高性能表现。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值