小编在学习套接字编程的过程中,经常碰到几个套接字地址类型,包括sockaddr、sockaddr_in、sockaddr_un,其中
sockaddr表示通用的套接字地址,是linux 网络通信的地址结构体的一种
sockaddr_in则是internet环境下套接字的地址形式,能够快速获取套接字地址的每一个字段
sockaddr_un是针对UNIX域套接字地址,是UNIX环境下套接字的地址形式。
其中,sockaddr的结构如下:
struct sockaddr {
unsigned short sa_family; /* address family, AF_xxx */
char sa_data[14]; /* 14 bytes of protocol address */
};
sa_family是地址家族,一般都是“AF_xxx”的形式。好像通常大多用的是都是AF_INET。
sa_data是14字节协议地址。
显然该结构体的大小为2+14=16 Byte
sockaddr_in的结构如下:
struct sockaddr_in {
short int sin_family; /* Address family */
unsigned short int sin_port; /* Port number */
struct in_addr sin_addr; /* Internet address */
unsigned char sin_zero[8]; /* Same size as struct sockaddr */
};
sin_family指代协议族,在socket编程中只能是AF_INET
sin_port存储端口号(使用网络字节顺序)
sin_addr存储IP地址,使用in_addr这个数据结构
sin_zero是为了让sockaddr与sockaddr_in两个数据结构保持大小相同而保留的空字节。
s_addr按照网络字节顺序存储IP地址
其中,in_addr的结构如下:
struct in_addr {
unsigned long s_addr;
};
typedef struct in_addr {
union {
struct{
unsigned char s_b1,
s_b2,
s_b3,
s_b4;
} S_un_b;
struct {
unsigned short s_w1,
s_w2;
} S_un_w;
unsigned long S_addr;
} S_un;
} IN_ADDR;
这里的in_addr是一个联合体结构,可以通过相应的字段获取不同粒度的数据,其中S_un_b可以看作是以Byte为粒度大小,包含了4个Byte,而S_un_w可以看作是以Word为粒度大小,包含了2个Word,而S_addr则是完整的8Byte 32Bit的IP地址表示。
显然该结构的大小为2+2+4+8=16 Byte
sockaddr_un的结构如下:
struct socketaddr_un
{
_SOCKADDR_COMMON(sun_); // __SOCKADDR_COMMON(sun_) 宏定义对应的定义为 sa_family_t sun_family
Char sun_path[108];
};
这是一种通用的定义,一般都不用。使用UNIX套接字作为进程间通信的一种方式,通常使用的往往不是网络套接字,而是一种称为本地套接字的方式。该地址结构就是用来表示本地套接字的结构,其中sun_path用来表示本地地址,通常是/tmp
除了上述的多种地址之外,还有一些需要注意的地方,就是网络字节序,我们知道在不同的计算机体系结构中,相同的数据可能存在不同的存储方式,也就是常说的大端和小端问题,而网络字节序则是大端方式,除了Byte之间的存储存在大小端问题之外,Bit之间也存在大小端问题,在计算机的存储中,Bit的大小端方式和Byte的大小端方式是保持一致的,也就说,对于大端方式而言,高位的Byte存放在低地址,而地位的Byte存放在高地址,同样一个Byte中的高位Bit也是存放在低位地址,而低位Bit则是存放在高位地址,小端方式则采用相似但相反的方式。
但是对于网络字节序而言,存在线地址一说,这个线地址就类似于内存中的物理地址,只不过在进行数据传输的时候,低位线地址一定优先于高位线地址进行传输,那么对于采用大端方式的网络字节序而言,高位Byte一定是存放在低位线地址,而低位Byte则是存放在高位线地址,但是对于同一个Byte的Bit而言情况就和计算机的存储不一样了,对于网络字节序而言,一个Byte的不同Bit的存储则是采用了相反的方式进行存储,也就是说采用的是小端的方式。换句话说,同一个Byte的高位Bit其实是存放在高位线地址,而低位的Bit则是存放在低位Bit,也就是说,低位的Bit比高位的Bit得到优先传输,这个转换是由NIC(Network Interface Card)来完成的。
具体的大小端说明,有具体的传送门:http://blog.youkuaiyun.com/hanhuili/article/details/7185836和http://www.linuxjournal.com/article/6788
此外,除了上述的一些基础问题,还有一些应用性问题值得注意:
在套接字编程过程中,对于一些可能存在的隐患问题需要注意:
其一:不要忽略每一个套接字编程API的返回值,因为有可能程序在某一个地方只运行成功了一部分,而出现问题的地方被程序猿忽略,导致bug不可寻。
其二:不要对帧做出同步假设,这是UDP和TCP的差异,其中,UDP能够保持消息报文的边界,而TCP则不对边界做出界定。
这里提供一个传送门:http://www.ibm.com/developerworks/cn/linux/l-sockpit/
还有一些就是常用的套接字API,用于网络字节序的转换:
1、ntohs、ntohl表示Network to Host
2、htons、htonl表示Host to Network
3、inet_addr表示将一个点分十进制的IP转换成一个长整数型数,此时已经是网络字节序
4、inet_ntoa表示Network to ASCII
以上就是关于网络套接字编程需要注意的一些地方。