作为传输层的主要协议,TCP协议不仅可以支持本地的数据通信,还可以支持跨网络的进程间通信。
在偌大的互联网中,我们可以通过“IP地址+端⼜号”标识互联网中唯一的一个进程。然而,“IP地址+端⼜号”就称为socket,这就是网络socket编程。
在TCP协议中,建⽴连接的两个进程各⾃有⼀个socket来标识,那么这两个socket组成 的socketpair就唯⼀标识⼀个连接。
socket本⾝有“插座”的意思,因此⽤来描述⽹络连接的⼀ 对⼀关系。
要写出一个基于TCP的网络服务程序,我们应该具有以下的知识:
- 发送主机通常将发送缓冲区中的数据按内存地址从低到⾼的顺序发出,接收主机把从⽹络上接到的字节依次保存在接收缓冲区中,也是按内存地址从低到⾼的顺序保存。
- TCP/IP协议规定,⽹络数据流应采⽤⼤端字节序,即低地址⾼字节。
- socket API是⼀层抽象的⽹络编程接⼜,适⽤于各种底层⽹络协议,如IPv4、 IPv6,以及后⾯要讲的UNIX Domain Socket。
IPv4和IPv6的地址格式定义在netinet/in.h中,IPv4地址⽤sockaddr_in结构体表⽰,包括16位端⼜号和32位IP地址,IPv6地址⽤sockaddr_in6结构体表⽰,包括16位端⼜号、 128位IP地址和⼀些 控制字段。 UNIX Domain Socket的地址格式定义在sys/un.h中,⽤sockaddr_un结构体表⽰。各 种socket地址结构体的开头都是相同的,前16位表⽰整个结构体的长度(并不是所有UNIX的实现 都有长度字段,如Linux就没有),后16位表⽰地址类型。 IPv4、 IPv6和UNIXDomain Socket的地 址类型分别定义为常数AF_INET、 AF_INET6、 AF_UNIX。这样,只要取得某种sockaddr结构体的 ⾸地址,不需要知道具体是哪种类型的sockaddr结构体,就可以根据地址类型字段确定结构体中的 内容。因此,socket API可以接受各种类型的sockaddr结构体指针做参数,例 如bind、 accept、 connect等函数,这些函数的参数应该设计成void *类型以便接受各种类型的指 针,但是sock API的实现早于ANSI C标准化,那时还没有void *类型,因此这些函数的参数都 ⽤struct sockaddr *类型表⽰,在传递参数之前要强制类型转换⼀下.结构如图所示:
通常⽤点分⼗进制的字符串表⽰IP 地址,以下函数可以在字符串表⽰ 和in_addr表⽰之间转换。
字符串转in_addr的函数: