关于union的基本概念和大小计算不再赘述,只重点提示一下,使用union的时候一定要注意初始化、初始化、初始化...重要的事情说三遍。初始化的方法可以直接初始化union中最长数据,也可以和struct一样使用ZeroMemory(this, sizeof(type_union));。
首先,从实用角度分析,不关注内存存储。假设有一个union定义如下:
typedef union u_test
{
char sztest;
int count;
u_test()
{
ZeroMemery(this, sizeof(u_test));
}
}ut;
当我们使用,
int main()
{
ut.sztest = 0x01;
printf("%02x", ut.count);
return 0;
}
从union的内存对齐上来看,union是从低位开始对齐的,那么ut.count此时应该是0x01000000,还是0x00000001呢?经过实际验证答案是后者,也就是说int整形输出时,系统会从前四字节自动从低位开始填充整形内存然后输出,即0x00000001.
同理,当我们定义一个IP地址转化的union时,可以使用如下方法:
typedef union u_ipaddress
{
BYTE ipaddr[4];
DWORD dwip;
u_test()
{
ZeroMemery(this, sizeof(u_test));
}
}uip;
int main()
{
uip ip;
ip.ipaddr[0] = 192;
ip.ipaddr[1] = 168;
ip.ipaddr[2] = 1;
ip.ipaddr[3] = 121;
printf("%d", ip.dwip); //此时对于ip.dwip来说:第一字节121、第二字节1、第三字节168、第四字节192
/*******************************************************
十六进制可能会更好理解一点
uip ip;
ip.ipaddr[0] = 0xC0;
ip.ipaddr[1] = 0xA8;
ip.ipaddr[2] = 0x01;
ip.ipaddr[3] = 0x79;
printf("%d", ip.dwip); //此时ip.dwip值为0x7901A8C0
********************************************************/
return 0;
}
显而易见,使用union做IP转换会非常方便,不用去一字节一字节的去取值,直接利用union的特性做转换即可。
为什么或出现这种现象呢?接下来内存中数据存储角度分析:
以int类型1为例,市面上大部分书籍说的都是数字的字节表示形式,按照二进制的方式进行存储。很多人就理所当然的认为是按照下面方式进行存储:
第1字节 第2字节 第3字节 第4字节
00000000 00000000 00000000 00000001
实际上恰好相反,在内存上是地位在前,高位在后的方式存储的,也就是以以下方式存储:
第1字节 第2字节 第3字节 第4字节
00000001 00000000 00000000 00000000
对于其他基本数据类型而言也都是这样存储的,拓展到结构体、联合体等复杂类型同样如此。
PS:题外,之前看其他帖子说到union数据转换相关,都会讲到以int为例的实际存储方式(二进制转换>>补码>>反码),实际存储也确实是这样,但针对union数据转换而言我们并不需要了解实际存储过程。
另外,从低地址到高地址这种存储方式为小端字节序;一般网络编程都是按照大段字节序方式,故涉及到网络编程时需要做字节序转换。关于大小端具体区别与应用本帖就不做详细讲解了。