Linux C编程(七) 之网络编程 (中)

最新推荐文章于 2021-07-18 20:15:08 发布

原创最新推荐文章于 2021-07-18 20:15:08 发布 · 280 阅读

0 ·

CC 4.0 BY-SA版权

Linux网络编程专栏收录该内容

13 篇文章

订阅专栏

本文详细介绍Linux下网络编程的基础知识，包括socket、bind、listen、connect、accept等关键API的使用，以及网络字节序与主机字节序的转换，read、write、send、recv等I/O操作函数的解析。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Linux下网络编程相关API

socket()函数

    int  socket(int protofamily, int type, int protocol);//返回sockfd
 sockfd是描述符。

socket函数对应于普通文件的打开操作。普通文件的打开操作返回一个文件描述字，而socket()用于创建一个socket描述符（socket descriptor），它唯一标识一个socket。这个socket描述字跟文件描述字一样，后续的操作都有用到它，把它作为参数，通过它来进行一些读写操作。
三个参数分别为：
protofamily：即协议域，又称为协议族（family）。常用的协议族有，AF_INET(IPV4)、AF_INET6(IPV6)、AF_LOCAL（或称AF_UNIX，Unix域socket）、AF_ROUTE等等。协议族决定了socket的地址类型，在通信中必须采用对应的地址，如AF_INET决定了要用ipv4地址（32位的）与端口号（16位的）的组合、AF_UNIX决定了要用一个绝对路径名作为地址。
type：指定socket类型。常用的socket类型有，SOCK_STREAM、SOCK_DGRAM、SOCK_RAW、SOCK_PACKET、SOCK_SEQPACKET等等
protocol：故名思意，就是指定协议。常用的协议有，IPPROTO_TCP、IPPTOTO_UDP、IPPROTO_SCTP、IPPROTO_TIPC等，它们分别对应TCP传输协议、UDP传输协议、STCP传输协议、TIPC传输协议

注意：并不是上面的type和protocol可以随意组合的，如SOCK_STREAM不可以跟IPPROTO_UDP组合。当protocol为0时，会自动选择type类型对应的默认协议。

bind函数

bind()函数把一个地址族中的特定地址赋给socket。例如对应AF_INET、AF_INET6就是把一个ipv4或ipv6地址和端口号组合赋给socket。

int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

函数的三个参数分别为：

sockfd：即socket描述字，它是通过socket()函数创建了，唯一标识一个socket。bind()函数就是将给这个描述字绑定一个名字。

addr：一个const struct sockaddr *指针，指向要绑定给sockfd的协议地址。这个地址结构根据地址创建socket时的地址协议族的不同而不同，如ipv4对应的是：

struct sockaddr_in {
     sa_family_t    sin_family; /* address family: AF_INET */
    in_port_t      sin_port;   /* port in network byte order */
    struct in_addr sin_addr;   /* internet address */
};
typedef unsigned short	sa_family_t;

/* Internet address. */
struct in_addr {
    uint32_t       s_addr;     /* address in network byte order */
};

addrlen：对应的是地址的长度。
通常服务器在启动的时候都会绑定一个众所周知的地址（如ip地址+端口号），用于提供服务，客户就可以通过它来接连服务器；而客户端就不用指定，有系统自动分配一个端口号和自身的ip地址组合。这就是为什么通常服务器端在listen之前会调用bind()，而客户端就不会调用，而是在connect()时由系统随机生成一个。
网络字节序与主机字节序
1. 主机字节序就是我们平常说的大端和小端模式：不同的CPU有不同的字节序类型，这些字节序是指整数在内存中保存的顺序，这个叫做主机序。引用标准的Big-Endian和Little-Endian的定义如下：
  　　a) Little-Endian就是低位字节排放在内存的低地址端，高位字节排放在内存的高地址端。
  　　b) Big-Endian就是高位字节排放在内存的低地址端，低位字节排放在内存的高地址端。
2. 网络字节序：4个字节的32 bit值以下面的次序传输：首先是0～7bit，其次8～15bit，然后16～23bit，最后是24~31bit。这种传输次序称作大端字节序。由于TCP/IP首部中所有的二进制整数在网络中传输时都要求以这种次序，因此它又称作网络字节序。字节序，顾名思义字节的顺序，就是大于一个字节类型的数据在内存中的存放顺序，一个字节的数据没有顺序的问题了。
  所以：在将一个地址绑定到socket的时候，请先将主机字节序转换成为网络字节序，而不要假定主机字节序跟网络字节序一样使用的是Big-Endian。

字节序转换

uint32_t htonl(uint32_t hostlong);//功能：把32位的主机字节序转换成32位网络字节序
uint16_t htons(uint16_t hostshort);//功能：把16位的主机字节序转换成16位网络字节序
uint32_t ntohl(uint32_t netlong);//功能：把32位网络字节序转换成32位的主机字节序
uint16_t ntohs(uint16_t netshort);//功能：把16位网络字节序转换成16位的主机字节序

除此之外，ip地址网络字节序和点分十进制字符串也需要转换

	功能：把点分十进制的字符串ip地址转换成32位的无符号整数
	in_addr_t inet_addr(const char *cp);
	功能：把32的的网络字节序的ip地址转换成点分十进制的字符串ip地址。
	char *inet_ntoa(struct in_addr in);

listen()、connect()函数

如果作为一个服务器，在调用socket()、bind()之后就会调用listen()来监听这个socket，如果客户端这时调用connect()发出连接请求，服务器端就会接收到这个请求。
```
  int listen(int sockfd, int backlog);
  int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
```
listen函数的第一个参数即为要监听的socket描述字，第二个参数为相应socket可以排队的最大连接个数。socket()函数创建的socket默认是一个主动类型的，listen函数将socket变为被动类型的，等待客户的连接请求。
connect函数的第一个参数即为客户端的socket描述字，第二参数为服务器的socket地址，第三个参数为socket地址的长度。客户端通过调用connect函数来建立与TCP服务器的连接。

accept()函数

TCP服务器端依次调用socket()、bind()、listen()之后，就会监听指定的socket地址了。TCP客户端依次调用socket()、connect()之后就向TCP服务器发送了一个连接请求。TCP服务器监听到这个请求之后，就会调用accept()函数取接收请求，这样连接就建立好了。之后就可以开始网络I/O操作了，即类同于普通文件的读写I/O操作。

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen); //返回连接connect_fd

参数sockfd
参数sockfd就是上面解释中的监听套接字，这个套接字用来监听一个端口，当有一个客户与服务器连接时，它使用这个一个端口号，而此时这个端口号正与这个套接字关联。当然客户不知道套接字这些细节，它只知道一个地址和一个端口号。
参数addr
这是一个结果参数，它用来接受一个返回值，这返回值指定客户端的地址，当然这个地址是通过某个地址结构来描述的，用户应该知道这一个什么样的地址结构。如果对客户的地址不感兴趣，那么可以把这个值设置为NULL。
参数len
如同大家所认为的，它也是结果的参数，用来接受上述addr的结构的大小的，它指明addr结构所占有的字节个数。同样的，它也可以被设置为NULL。
如果accept成功返回，则服务器与客户已经正确建立连接了，此时服务器通过accept返回的套接字来完成与客户的通信。
注意：
accept默认会阻塞进程，直到有一个客户连接建立后返回，它返回的是一个新可用的套接字，这个套接字是连接套接字。
我们需要区分两种套接字，
1. 监听套接字: 监听套接字正如accept的参数sockfd，它是监听套接字，在调用listen函数之后，是服务器开始调用socket()函数生成的，称为监听socket描述字(监听套接字)
2. 连接套接字：一个套接字会从主动连接的套接字变身为一个监听套接字；而accept函数返回的是已连接socket描述字(一个连接套接字)，它代表着一个网络已经存在的点点连接。
一个服务器通常通常仅仅只创建一个监听socket描述字，它在该服务器的生命周期内一直存在。内核为每个由服务器进程接受的客户连接创建了一个已连接socket描述字，当服务器完成了对某个客户的服务，相应的已连接socket描述字就被关闭。

read()、write()等函数

服务器与客户建立好连接后。需要调用网络I/O进行读写操作，网络I/O操作有下面几组：
• read()/write()
• recv()/send()
• readv()/writev()
• recvmsg()/sendmsg()
• recvfrom()/sendto()
recvmsg()/sendmsg()是最通用的I/O函数，实际上可以把上面的其它函数都替换成这两个函数。它们的声明如下：
#include <unistd.h>

   ssize_t read(int fd, void *buf, size_t count);
   ssize_t write(int fd, const void *buf, size_t count);

   #include <sys/types.h>
   #include <sys/socket.h>

   ssize_t send(int sockfd, const void *buf, size_t len, int flags);
   ssize_t recv(int sockfd, void *buf, size_t len, int flags);

   ssize_t sendto(int sockfd, const void *buf, size_t len, int flags,
                  const struct sockaddr *dest_addr, socklen_t addrlen);
   ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags,
                    struct sockaddr *src_addr, socklen_t *addrlen);

   ssize_t sendmsg(int sockfd, const struct msghdr *msg, int flags);
   ssize_t recvmsg(int sockfd, struct msghdr *msg, int flags);

read函数是负责从fd中读取内容.当读成功时，read返回实际所读的字节数，如果返回的值是0表示已经读到文件的结束了，小于0表示出现了错误。如果错误为EINTR说明读是由中断引起的，如果是ECONNREST表示网络连接出了问题。
write函数将buf中的nbytes字节内容写入文件描述符fd.成功时返回写的字节数。失败时返回-1，并设置errno变量。在网络程序中，当我们向套接字文件描述符写时有俩种可能。1)write的返回值大于0，表示写了部分或者是全部的数据。2)返回的值小于0，此时出现了错误。我们要根据错误类型来处理。如果错误为EINTR表示在写的时候出现了中断错误。如果为EPIPE表示网络连接出现了问题(对方已经关闭了连接)。
send函数
不论是客户还是服务器应用程序都可用send函数来向TCP连接的另一端发送数据。客户程序一般用send函数向服务器发送请求，而服务器则通常用send函数来向客户程序发送应答。

该函数的第一个参数指定发送端套接字描述符；
第二个参数指明一个存放应用程序要发送数据的缓冲区；
第三个参数指明实际要发送的数据的字节数；
第四个参数一般置0。

当调用该函数时，

（1）send先比较待发送数据的长度len和套接字s的发送缓冲的长度，如果len大于s的发送缓冲区的长度，该函数返回SOCKET_ERROR；
（2）如果len小于或者等于s的发送缓冲区的长度，那么send先检查协议是否正在发送s的发送缓冲中的数据，如果是就等待协议把数据发送完，如果协议还没有开始发送s的发送缓冲中的数据或者s的发送缓冲中没有数据，那么send就比较s的发送缓冲区的剩余空间和len
（3）如果len大于剩余空间大小，send就一直等待协议把s的发送缓冲中的数据发送完
（4）如果len小于剩余空间大小，send就仅仅把buf中的数据copy到剩余空间里（注意并不是send把s的发送缓冲中的数据传到连接的另一端的，而是协议传的，send仅仅是把buf中的数据copy到s的发送缓冲区的剩余空间里）。

如果send函数copy数据成功，就返回实际copy的字节数，如果send在copy数据时出现错误，那么send就返回SOCKET_ERROR；如果send在等待协议传送数据时网络断开的话，那么send函数也返回SOCKET_ERROR。

要注意send函数把buf中的数据成功copy到s的发送缓冲的剩余空间里后它就返回了，但是此时这些数据并不一定马上被传到连接的另一端。如果协议在后续的传送过程中出现网络错误的话，那么下一个Socket函数就会返回SOCKET_ERROR。（每一个除send外的Socket函数在执行的最开始总要先等待套接字的发送缓冲中的数据被协议传送完毕才能继续，如果在等待时出现网络错误，那么该Socket函数就返回 SOCKET_ERROR）

注意：在Unix系统下，如果send在等待协议传送数据时网络断开的话，调用send的进程会接收到一个SIGPIPE信号，进程对该信号的默认处理是进程终止。

recv函数

客户端和服务器应用程序都可用recv函数从TCP连接的另一端接收数据。

第一个参数指定接收端套接字描述符；
第二个参数指明一个缓冲区，该缓冲区用来存放recv函数接收到的数据；
第三个参数指明buf的长度；
第四个参数一般置0。

当应用程序调用recv函数时

（1）recv先等待s的发送缓冲中的数据被协议传送完毕，如果协议在传送s的发送缓冲中的数据时出现网络错误，那么recv函数返回SOCKET_ERROR，

（2）如果s的发送缓冲中没有数据或者数据被协议成功发送完毕后，recv先检查套接字s的接收缓冲区，如果s接收缓冲区中没有数据或者协议正在接收数据，那么recv就一直等待，直到协议把数据接收完毕。当协议把数据接收完毕，recv函数就把s的接收缓冲中的数据copy到buf中（注意协议接收到的数据可能大于buf的长度，所以在这种情况下要调用几次recv函数才能把s的接收缓冲中的数据copy完。recv函数仅仅是copy数据，真正的接收数据是协议来完成的），

recv函数返回其实际copy的字节数。如果recv在copy时出错，那么它返回SOCKET_ERROR；如果recv函数在等待协议接收数据时网络中断了，那么它返回0。

注意：在Unix系统下，如果recv函数在等待协议接收数据时网络断开了，那么调用recv的进程会接收到一个SIGPIPE信号，进程对该信号的默认处理是进程终止。

sendto函数

 ssize_t sendto(int sockfd, const void *buf, size_t len, int flags, const struct sockaddr *dest_addr, socklen_t addrlen);

ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags,
struct sockaddr *src_addr, socklen_t *addrlen);

sockfd: 套接字描述符，如果调用方法 sendto 是通信双方中的 client端的话，是无需调用 connect 方法的；如果是 server 端的话，是无需调用 accept 方法来返回新的套接字描述符的，
buf: 该参数是一个指针，指向的是待发送数据所存放的缓冲区
len : 该参数是用来标定待发送的数据有多少个字节
flags : 该参数的用法同 send 函数中的 flags ，它是用来设定发送到对端的数据的类型以及发送方式,一般设置为0
dest_addr: 由于 sendto 是 UDP 网络传输协议的实现，是不面向连接的，所以每次发送数据的时候，都会通过该函数来指定接收数据的目的端的网络地址信息
addrlen: 我们应该清楚的是，参数5 所传递的仅仅是指向一块空间的指针，该指针所指向空间中的有效数据有多少是无法通过指针来得知的，所以需要传送一个用来标定该指针指向的空间中有多少个字节的信息是有效的， addrlen用于标定 dest_addr指向的空间中地址数据所占用的字节个数

返回值：函数的返回值表明了成功将多少字节的数据从进程内存发送到内核中的缓冲空间中。成功发送并不代表成功的将数据发送到对方的主机上（很难说这边发送了多少，对方就能够完全正确的接收）因为网络中数据的传输要远比语言中抽象表达的要复杂，延迟、丢包等等都有可能导致成功发送的数据不能全部被对方接收。

recvfrom函数

ssize_t recvfrom ( int s , void *buf , ssize_t len , int flags , struct sockaddr * from , socklen_t *fromlen ) ;

参数

s : 套接字描述符，client 端调用 socket 函数的返回值， server 端在调用socket , bind 函数成功之后，socket 函数的返回值。
buf: 指向在进程内存中存放来自于内核缓冲区接收到的数据，系统首先会从网络中收集数据，然后将数据从内核缓冲区中移动到通讯进程的内存空间中，而 buf 便是指向内存空间的指针。
len : 该参数用来告诉内核内存空间的最大容量是多少，内核每次将内核缓冲区中的数据移到内存空间中的时候，会根据内存空间的大小 len 来移动指定数目的数据
flags : 该参数用来控制或限制接收数据一端，应该接收什么何种类型的数据，用法同 recv 中 flags 参数的的用法
from : 该参数也是值-结果参数，用来指向一块空闲空间，在 recvfrom 方法调用之后，该空闲空间中将会被写入发送数据的通信端的网络地址信息，如果数据接收端需要知道数据发送端的网络地址信息，将写入该指针指向的空间中的数据便可获知
fromlen : 参数 5 地址指针所指向的空间中，有效数据的长度是多少

成功则返回接收到的字符数，失败则返回-1，错误原因存于errno中。

sendmsg函数和recvmsg函数

recvmsg和sendmsg是最通用的I/O函数，只要设置好参数，read、readv、recv、recvfrom和write、writev、send、sendto等函数都可以对应换成这两个函数来调用。
```
  #include <sys/socket.h>
  ssize_t recvmsg(int sockfd, struct msghdr *msg, int flags);
  ssizt_t sendmsg(int sockfd, struct msghdr *msg, int flags);
```

函数的参数少，说明msghdr参数就比较复杂了，因为需要的参数都被封装到这个参数了。msghdr数据结构如下：

	struct msghdr {
	    void          *msg_name;            /* protocol address */
	    socklen_t     msg_namelen;          /* sieze of protocol address */
	    struct iovec  *msg_iov;             /* scatter/gather array */
	    int           msg_iovlen;           /* # elements in msg_iov */
	    void          *msg_control;         /* ancillary data ( cmsghdr struct) */
	    socklen_t     msg_conntrollen;      /* length of ancillary data */
	    int           msg_flags;            /* flags returned by recvmsg() */
	}

结构成员可以分为四组。他们是：

套接口地址成员msg_name与msg_namelen。
I/O向量引用msg_iov与msg_iovlen。
附属数据缓冲区成员msg_control与msg_controllen。
接收信息标记位msg_flags。

成员msg_name与msg_namelen
这些成员只有当我们的套接口是一个数据报套接口时才需要(UDP数据报传输时)。msg_name成员指向我们要发送或是接收信息的套接口地址。成员msg_namelen指明了这个套接口地址的长度。
当调用recvmsg时，msg_name会指向一个将要接收的地址的接收区域。当调用sendmsg时，这会指向一个数据报将要发送到的目的地址。
**注意，msg_name定义为一个(void )数据类型。我们并不需要将我们的套接口地址转换为(struct sockaddr )。
成员msg_iov与msg_iovlen
这些成员指定了我们的I/O向量数组的位置以及他包含多少项。msg_iov成员指向一个struct iovec数组。我们将会回忆起I/O向量指向我们的缓冲区。成员msg_iov指明了在我们的I/O向量数组中有多少元素。
```
  struct iovec {
  	    /* Starting address (内存起始地址）*/
  	  	void  *iov_base;   
  	    /* Number of bytes to transfer（这块内存长度） */
  	    size_t iov_len;    
     };
```
成员msg_control与msg_controllen
这些成员指向了我们附属数据缓冲区并且表明了缓冲区大小。msg_control指向附属数据缓冲区，而msg_controllen指明了缓冲区大小。
成员msg_flags
当使用recvmsg时，这个成员用于接收特定的标记位(他并不用于sendmsg)。在这个位置可以接收的标记位如下表所示：

标记位	描述
MSG_EOR	当接收到记录结尾时会设置这一位。这通常对于SOCK_SEQPACKET套接口类型十分有用。
MSG_TRUNC	这个标记位表明数据的结尾被截短，因为接收缓冲区太小不足以接收全部的数据。
MSG_CTRUNC	这个标记位表明某些控制数据(附属数据)被截短，因为缓冲区太小。
MSG_OOB	这个标记位表明接收了带外数据。
MSG_ERRQUEUE	这个标记位表明没有接收到数据，但是返回一个扩展错误。

close()函数

在服务器与客户端建立连接之后，会进行一些读写操作，完成了读写操作就要关闭相应的socket描述字，好比操作完打开的文件要调用fclose关闭打开的文件。

#include <unistd.h>
int close(int fd);

close一个TCP socket的缺省行为时把该socket标记为以关闭，然后立即返回到调用进程。该描述字不能再由调用进程使用，也就是说不能再作为read或write的第一个参数。

注意：close操作只是使相应socket描述字的引用计数-1，只有当引用计数为0的时候，才会触发TCP客户端向服务器发送终止连接请求。

shutdown函数

#include<sys/socket.h>
int shutdouwn(int sockfd,int howto);

sockfd：待关闭的 socket
howto：shutdown 行为