day01-从最简单的socket开始
本教程主要是用来记录笔者的实践学习过程。
想要实现最简单的服务端和客户端的通信,需要以下几个基本组件和步骤:
-
网络协议:决定服务端和客户端之间将使用哪种网络协议进行通信,常见的协议包括HTTP/HTTPS(用于Web应用)、TCP/IP、UDP等。
-
服务器和端口:服务端需要一个服务器来处理来自客户端的请求,并监听一个端口以等待这些请求。
-
客户端应用:创建一个客户端应用程序,它能够发送请求到服务端,并接收服务端的响应。
那这个跟socket有什么关系呢?
Socket(翻译为“套接字”)是一种非常重要的概念。Socket是网络通信的基本构建块,它提供了一个抽象层,允许程序发送和接收数据,而无需关心底层网络协议的细节。
Socket与服务端和客户端通信之间的关系:
-
网络协议:Socket可以支持多种网络协议,包括TCP/IP和UDP。TCP(传输控制协议)提供了可靠的、面向连接的通信,而UDP(用户数据报协议)则提供了一种不可靠的、无连接的通信方式。根据应用的需求,开发者可以选择使用TCP或UDP Socket。
-
服务器和端口:服务端的Socket会绑定到一个特定的端口上,这个端口号用于标识服务端上的特定服务。客户端通过这个端口号来建立连接,发送请求。服务器监听这个端口,等待客户端的连接请求。
-
客户端应用:客户端的Socket用于建立与服务端的连接,发送请求,并接收响应。客户端Socket不需要绑定到特定的端口,除非它也作为服务器来接受其他客户端的连接。
-
建立连接:在TCP Socket中,通信双方需要通过一个称为“三次握手”的过程来建立连接。一旦连接建立,数据就可以在客户端和服务器之间传输。
-
数据传输:一旦Socket连接建立,数据就可以通过这个连接传输。在TCP Socket中,数据传输是有序的、可靠的,并且保证数据的完整性。而在UDP Socket中,数据传输是不可靠的,可能会丢失或乱序到达。
-
关闭连接:数据传输完成后,需要关闭Socket连接。在TCP中,这通常涉及到一个“四次挥手”的过程来优雅地关闭连接。
简而言之,Socket是实现服务端和客户端之间通信的技术基础,它提供了必要的接口来发送和接收数据,而网络协议(如TCP/IP或UDP)则定义了这些数据传输的具体规则。
知道概念后,我们可以开始尝试写一个简单的socket。
首先在服务器,我们需要建立一个socket套接字,对外提供一个网络通信接口,在Linux系统中这个套接字竟然仅仅是一个文件描述符,也就是一个int
类型的值!这个对套接字的所有操作(包括创建)都是最底层的系统调用。
#include <sys/socket.h>
int sockfd = socket(AF_INET, SOCK_STREAM, 0);
- 第一个参数:IP地址类型,AF_INET表示使用IPv4,如果使用IPv6请使用AF_INET6。
- 第二个参数:数据传输方式,SOCK_STREAM表示流格式、面向连接,多用于TCP。SOCK_DGRAM表示数据报格式、无连接,多用于UDP。
- 第三个参数:协议,0表示根据前面的两个参数自动推导协议类型。设置为IPPROTO_TCP和IPPTOTO_UDP,分别表示TCP和UDP。
对于客户端,服务器存在的唯一标识是一个IP地址和端口,这时候我们需要将这个套接字绑定到一个IP地址和端口上。首先创建一个sockaddr_in结构体
#include <arpa/inet.h> //这个头文件包含了<netinet/in.h>,不用再次包含了
struct sockaddr_in serv_addr;
memset(&serv_addr, 0, sizeof(serv_addr));
然后使用memset
初始化这个结构体,这个函数在头文件<cstring>
中。这里用到了两条《Effective C++》的准则:
条款04: 确定对象被使用前已先被初始化。如果不清空,使用gdb调试器查看addr内的变量,会是一些随机值,未来可能会导致意想不到的问题。
条款01: 视C++为一个语言联邦。把C和C++看作两种语言,写代码时需要清楚地知道自己在写C还是C++。如果在写C,请包含头文件<string.h>
。如果在写C++,请包含<cstring>
。
设置地址族、IP地址和端口:
serv_addr.sin_family = AF_INET;
serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1");
serv_addr.sin_port = htons(8888);
然后将socket地址与文件描述符绑定:
bind(sockfd, (sockaddr*)&serv_addr, sizeof(serv_addr));
为什么定义的时候使用专用socket地址(sockaddr_in)而绑定的时候要转化为通用socket地址(sockaddr),以及转化IP地址和端口号为网络字节序的inet_addr
和htons
等函数及其必要性,在游双《Linux高性能服务器编程》第五章第一节:socket地址API中有详细讨论。
最后我们需要使用listen
函数监听这个socket端口,这个函数的第二个参数是listen函数的最大监听队列长度,系统建议的最大值SOMAXCONN
被定义为128。
listen(sockfd, SOMAXCONN);
要接受一个客户端连接,需要使用accept
函数。对于每一个客户端,我们在接受连接时也需要保存客户端的socket地址信息,于是有以下代码:
struct sockaddr_in clnt_addr;
socklen_t clnt_addr_len = sizeof(clnt_addr);
bzero(&clnt_addr, sizeof(clnt_addr));
int clnt_sockfd = accept(sockfd, (sockaddr*)&clnt_addr, &clnt_addr_len);
printf("new client fd %d! IP: %s Port: %d\n", clnt_sockfd, inet_ntoa(clnt_addr.sin_addr), ntohs(clnt_addr.sin_port));
要注意和accept
和bind
的第三个参数有一点区别,对于bind
只需要传入serv_addr的大小即可,而accept
需要写入客户端socket长度,所以需要定义一个类型为socklen_t
的变量,并传入这个变量的地址。另外,accept
函数会阻塞当前程序,直到有一个客户端socket被接受后程序才会往下运行。
到现在,客户端已经可以通过IP地址和端口号连接到这个socket端口了,让我们写一个测试客户端连接试试:
int sockfd = socket(AF_INET, SOCK_STREAM, 0);
struct sockaddr_in serv_addr;
memset(&serv_addr, 0, sizeof(serv_addr));
serv_addr.sin_family = AF_INET;
serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1");
serv_addr.sin_port = htons(8888);
connect(sockfd, (sockaddr*)&serv_addr, sizeof(serv_addr));
代码和服务器代码几乎一样:创建一个socket文件描述符,与一个IP地址和端口绑定,最后并不是监听这个端口,而是使用connect
函数尝试连接这个服务器。
至此,day01的教程已经结束了,进入code/day01
文件夹,使用make命令编译,将会得到server
和client
。输入命令./server
开始运行,直到accept
函数,程序阻塞、等待客户端连接。然后在一个新终端输入命令./client
运行客户端,可以看到服务器接收到了客户端的连接请求,并成功连接。
new client fd 3! IP: 127.0.0.1 Port: 53505
这里的fd 为什么是从3开始,可以思考一下!
在Unix系统中,文件描述符0、1和2被预留给了标准输入(stdin)、标准输出(stdout)和标准错误(stderr),分别对应文件描述符0、1和2。这三个文件描述符是每个进程默认打开的,用于基本的输入输出操作。这种设计使得程序员在编写程序时可以依赖于0、1和2这三个文件描述符总是指向标准输入输出,而不必担心它们被其他文件或Socket占用。同时,这也意味着用户创建的文件描述符总是从3开始递增。
但如果我们先运行客户端、后运行服务器,在客户端一侧无任何区别,却并没有连接服务器成功,因为我们day01的程序没有任何的错误处理。
事实上对于如socket
,bind
,listen
,accept
,connect
等函数,通过返回值以及errno
可以确定程序运行的状态、是否发生错误。在day02的教程中,我们会进一步完善整个服务器,处理所有可能的错误,并实现一个echo服务器(客户端发送给服务器一个字符串,服务器收到后返回相同的内容)。
server.cpp的源码:
#include <stdio.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <string.h>
int main() {
int sockfd = socket(AF_INET, SOCK_STREAM, 0);
struct sockaddr_in serv_addr;
memset(&serv_addr, 0, sizeof(serv_addr));
serv_addr.sin_family = AF_INET;
serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1");
serv_addr.sin_port = htons(8888);
bind(sockfd, (sockaddr*)&serv_addr, sizeof(serv_addr));
listen(sockfd, SOMAXCONN);
struct sockaddr_in clnt_addr;
socklen_t clnt_addr_len = sizeof(clnt_addr);
bzero(&clnt_addr, sizeof(clnt_addr));
int clnt_sockfd = accept(sockfd, (sockaddr*)&clnt_addr, &clnt_addr_len);
printf("new client fd %d! IP: %s Port: %d\n", clnt_sockfd, inet_ntoa(clnt_addr.sin_addr), ntohs(clnt_addr.sin_port));
return 0;
}
client.cpp的源码:
#include <sys/socket.h>
#include <arpa/inet.h>
#include <string.h>
int main() {
int sockfd = socket(AF_INET, SOCK_STREAM, 0);
struct sockaddr_in serv_addr;
memset(&serv_addr, 0, sizeof(serv_addr));
serv_addr.sin_family = AF_INET;
serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1");
serv_addr.sin_port = htons(8888);
//bind(sockfd, (sockaddr*)&serv_addr, sizeof(serv_addr)); 客户端不进行bind操作
connect(sockfd, (sockaddr*)&serv_addr, sizeof(serv_addr));
return 0;
}
Makefile
server &&client:
g++ server.cpp -o server && g++ client.cpp -o client
这里需要注意server和client中的sockfd不是同一个。
在网络编程中,客户端(client)和服务器端(server)的文件描述符(fd)不是同一个。文件描述符(fd)是一个抽象层,用于访问文件、套接字和其他I/O流。每个打开的文件或套接字都会被操作系统分配一个唯一的非负整数作为文件描述符。
以下是客户端和服务器端文件描述符的主要区别:
-
服务器端文件描述符:
- 服务器端通常首先创建一个套接字(socket),并将其绑定(bind)到一个特定的IP地址和端口上。
- 然后服务器监听(listen)这个套接字,等待客户端的连接请求。
- 当一个客户端发起连接时,服务器接受(accept)这个连接请求,创建一个新的套接字来处理与客户端的通信。
- 这个新的套接符也会有一个唯一的文件描述符。
-
客户端文件描述符:
- 客户端创建一个套接字,并尝试连接到服务器端的IP地址和端口。
- 一旦连接建立,客户端的套接字也会有一个唯一的文件描述符,用于与服务器端通信。
在TCP连接的三次握手过程中,客户端和服务器端各自维护自己的套接字和文件描述符。服务器端的监听套接字(用于接受新的连接)和已接受连接的套接字(用于数据传输)有不同的文件描述符。客户端在整个连接过程中使用同一个套接字和文件描述符。
因此,客户端和服务器端的文件描述符是不同的,它们分别用于标识和管理系统资源中的不同套接字。