《Linux高级程序设计》读书笔记3

最新推荐文章于 2025-12-23 10:02:58 发布

原创最新推荐文章于 2025-12-23 10:02:58 发布 · 145 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#Linux #读书 #网络应用 #Socket #网络协议

Programming 专栏收录该内容

10 篇文章

订阅专栏

本文详细介绍了Linux下的网络编程，包括套接字编程的基础概念、如何使用面向连接和无连接的套接字进行通信，以及利用libCurl简化网络操作的方法。

第四章　软件配置管理

讲述了SCM的必要性,CVS, SVN, GIT等工具，个人认为这些东西不需要深入，除非你是靠软件配置管理吃饭的。

第五章　网络编程

如何为Linux程序增加网络功能？

1. 原始套接字编程，直接调用Linux网络子系统。可以编写任何通信协议以在任何网络设备之间通信。

2. 在应用程序中使用预包装的网络编程函数库。网络编程函数是现成的，调用即可。

5.1 Linux套接字编程

Unix的一个特征就是文件描述符，一个文件描述符提供一个文件对象的编程接口。系统里每一个对象都被定义为文件，所以每一个文件描述符可以被用于在UNIX系统中的不同对象之间发送和接收数据。

4.2BSD UNIX开始，网络访问也被定义为可以使用文件描述符。通过网络向一个远程设备发送数据如同发送数据给一个本地文件一样简单。网络文件描述符用来允许程序访问网络子系统。

5.1.1　套接字

Linux网络编程中，不需要直接访问网络接口设备来发送和接收数据报。而通过创建一个中间的文件描述符来处理网络编程接口。定义数据出入设备和如何发送的细节由Linux操作系统来处理。

指代网络连接的特殊文件描述符:套接字(Socket)，定义了一个特定的通信域(网络连接/IPC管道)、一个特定的通信类型(stream/datagram)、一个特定的协议(TCP/UDP)。创建socket->绑定socket到特定网络地址和端口/远程网络地址和端口/发送和接收数据。

手册里对于socket的定义是：create an endpointer for communication : 用于创建通信的端点。

#include <sys/types.h>          /* See NOTES */
#include <sys/socket.h>

       int socket(int domain, int type, int protocol);

手册里关于domain的划分

        Name                        Purpose                                      Man page
       PF_UNIX, PF_LOCAL   Local communication                  unix(7)
       PF_INET                     IPv4 Internet protocols               ip(7)
       PF_INET6                   IPv6 Internet protocols               ipv6(7)
       PF_IPX                       IPX - Novell protocols
       PF_NETLINK               Kernel user interface device        netlink(7)
       PF_X25                      ITU-T X.25 / ISO-8208 protocol    x25(7)
       PF_AX25                    Amateur radio AX.25 protocol
       PF_ATMPVC                Access to raw ATM PVCs
       PF_APPLETALK           Appletalk                                      ddp(7)
       PF_PACKET                Low level packet interface            packet(7)

手册中关于type的定义

     SOCK_STREAM    面向连接通信的数据包
    SOCK_DGRAM    无连接通信的数据包
    SOCK_SEQPACKET  使用面向连接的固定最大长度的数据包  
    SOCK_RAW            　使用原始ip数据包
    SOCK_RDM              使用一个可靠的数据包层但是不保证数据包到达的顺序

创建一个简单的用于网络通信的socket:

int newsocket;
newsocket = socket(PF_INET, SOCK_STREAM, 0);

新的文件描述符就是newsocket，描述了使用面向连接的字节流来传输数据给远程主机。

5.1.2 网络地址

Linux提供了一个专用于IP的地址结构sockaddr_in，定义为：

/* Structure describing an Internet socket address.  */
struct sockaddr_in
  {
    __SOCKADDR_COMMON (sin_);
    in_port_t sin_port;                 /* Port number.  */
    struct in_addr sin_addr;            /* Internet address.  */

    /* Pad to size of `struct sockaddr'.  */
    unsigned char sin_zero[sizeof (struct sockaddr) -
                           __SOCKADDR_COMMON_SIZE -
                           sizeof (in_port_t) -
                           sizeof (struct in_addr)];
  };

sin_family: 地址族(定义为short类型)，IP通信来说，应该被设置为AF_INET，以表示使用因特网地址族
sin_port:   端口号
sin_addr:   地址
sin_data:    8字节的填充

地址和端口号的引入是为了解决字节序的问题，不同的系统采用不同的字节序，所以必须提供转换函数。

htons: short value turn from host to network.

inet_addr(): 点分十进制表示的IP地址从字符串转换为long类型的网络字节序。

gethostbyname()：与域名对应的IP地址

struct sockaddr_in myconnection;
memset(&myconnection, 0, sizeof(myconnection));
myconnection.sin_family = AF_INET;
myconnection.sin_port = htons(8000);
myconnection.sin_addr.s_addr = inet_addr("192.168.0.133");

5.1.3 面向连接的套接字

1. 服务器函数

bind():

#include <sys/types.h>          /* See NOTES */
#include <sys/socket.h>

       int bind(int sockfd, const struct sockaddr *addr,
                socklen_t addrlen);

sockfd使用socket()的返回值。addr使用sockaddr类型的地址/端口组合来定义本地网络连接.length表明sockaddr结构的长度。

int s;
s = socket(PF_INET, SOCK_STREAM, 0);
struct sockaddr_in myaddr;
bind(s, (struct sockaddr *)&myaddr, sizeof(struct sockaddr));

bind成功时返回0，失败时返回-1。

listen():

       #include <sys/types.h>          /* See NOTES */
       #include <sys/socket.h>

       int listen(int sockfd, int backlog);

sockfd:　socket()返回的地址描述符,backlog是系统可接受的等待处理的连接队列长度。如果被设置为2，则系统在制定的端口可以同时接受两个独立客户端的连接请求。其中一个立刻被处理，另一个处于等待队列中，第三个连接请求到来，系统将拒绝该连接请求，因为连接长度已经达到backlog最长值。

       #include <sys/types.h>          /* See NOTES */
       #include <sys/socket.h>

       int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

accept()返回一个新的套接字描述符，新的套接字将用于与远程客户进行通信。而socket()创建的套接字可以用来监听更多的客户端连接。

send()和recv()都可以看标准的man手册

2. 客户端函数

区别是用connect代替bind函数

     #include <sys/types.h>          /* See NOTES */
       #include <sys/socket.h>

       int connect(int sockfd, const struct sockaddr *serv_addr,
                   socklen_t addrlen);

3. 关闭连接

可以使用shutdown 函数来指定通信会话终止的方式。

       #include <sys/socket.h>

       int shutdown(int s, int how);

how的选项：0 不再接收数据包　1　不再发送数据包　2　不再发送或接收数据包

5.1.4 使用无连接套接字

无连接套接字不会在网络设备之间创建一个专用的连接，数据被扔到网络中，希望它们能自己到达指定的目的地。好处：传输开销小，不需要跟踪每一个数据包。吞吐量高，但是不可靠。

SOCK_DGRAM来指定套接字类型，sendto和recvfrom函数来发送和接收。

ssize_t sendto(int s, const void *buf, size_t len, int flags,
                      const struct sockaddr *to, socklen_t tolen);
ssize_t recvfrom(int s, void *buf, size_t len, int flags,
                        struct sockaddr *from, socklen_t *fromlen);

接收到的消息储存在buf中，sendto中，发送的消息储存在buf中。flags一般情况

关键代码：

Client端：
 if ((len = sendto(s, buf, strlen(buf), 0, (struct sockaddr *)&remote_addr, sizeof(struct sockaddr))) < 0)
        {
                perror("sendto");
                return 1;
        }
Serve端：
  if ((len=recvfrom(s, buf, BUFSIZ, 0, (struct sockaddr *)&remote_addr, &sin_size)) < 0)
        {
                perror("recvfrom");
                return 1;
        }

5.2　传输数据

5.2.1 数据报与字节流

TCP和UDP通信之间最核心的差异是通过网络发送数据的方法。UDP协议以消息的形式发送数据，这个消息被称为数据报。TCP则是通过字节流技术来处理数据。send()发送的数据将被放到一个字节流中并通过网络被传递到接收主机。

badserver.c:
len = recv(fd, buf, BUFSIZ, 0);
betterserver.c:
len = recv(fd, buf, 13, 0);

TCP里面没有消息边界的概念，当消息使用send()函数发送并使用recv()函数接收时，它们不一定在发送和接收时使用相同的边界，因为TCP有处理数据的内部缓冲区。

导致：两次由send()函数调用发送的数据可以被一次recv()函数所调用读取。

5.2.2　标记消息边界

1.使用消息长度

每个消息的长度都相同／每个消息中都包含其长度的定义

2. 使用消息标记

结束标记是一个预先定义的字符，用于界定一个消息的结尾。当标记程序接收数据时，它必须扫描到达的数据以找出结束标记。如果发现结束标记，就将这个完整的消息传递给程序来处理。

使用ASCII字符集的许多系统来说，标准消息结束标记：回车换行符。检查数据包每一个字节，如果不是结束标记，则添加到临时缓冲区。若发现消息结束标记，临时缓冲区中的数据将被传输到永久缓冲区中以便使用。然后临时缓冲区被清空以接收下一个消息。

5.3　使用网络编程函数库。

Curl软件包是一个开源项目，它为流行的网络协议提供了命令行工具，只需要执行一个简单的命令行程序就可以和远程的服务器进行网络通信。网络连接所需要的所有参数都可以在命令行上定义。libCurl是一个标准的函数库，提供了可以用于实现Curl支持的所有网络协议的C语言API函数。curl.haxx.se是其网站。使用#include <curl/curl.h>

 CURL *curl;
CURLcode res;    //返回的对象。
        curl = curl_easy_init();
        if(!curl)
        {
                perror("curl");
                return 1;
        }

 #include <curl/curl.h>

       CURLcode curl_easy_setopt(CURL *handle, CURLoption option, parameter);
具体的option和parameter可以从man手册中得到。

简单的代码如下

#include <stdio.h>
#include <curl/curl.h>

int main(int argc, char *argv[])
{
        CURL *curl;
        CURLcode res;

        curl = curl_easy_init();
        if(!curl)
        {
                perror("curl");
                return 1;
        }
        curl_easy_setopt(curl, CURLOPT_URL, argv[1]);
       // curl_easy_setopt(curl, CURLOPT_PROXY, "webproxy:8080");
        res = curl_easy_perform(curl);

        curl_easy_cleanup(curl);
        return 0;
}

2. 保存接收到的数据

CURLOPT_WRITEDATA选项允许你定义一个流，接收到的数据将传递给这个流而不是发送给标准输出。你可以在流中执行任何你想要的数据处理，并控制在应用程序中显示哪些数据。

CURLOPT_WRITEHEADER制定是否要定义协议头的保存。

#include <stdio.h>
#include <curl/curl.h>

int main(int argc, char **argv)
{
   CURL *curl;
   CURLcode result;
   FILE *headerfile, *bodyfile;

   headerfile = fopen("header.txt", "w");
   bodyfile = fopen("body.txt", "w");
   curl = curl_easy_init();
   if (!curl)
   {
      perror("curl");
      return 1;
   }
   curl_easy_setopt(curl, CURLOPT_URL, argv[1]);
   curl_easy_setopt(curl, CURLOPT_WRITEHEADER, headerfile);
   curl_easy_setopt(curl, CURLOPT_WRITEDATA, bodyfile);

   curl_easy_setopt(curl, CURLOPT_VERBOSE, 1);

   result = curl_easy_perform(curl);
   curl_easy_cleanup(curl);

   fclose(headerfile);
   fclose(bodyfile);
   return 0;
}

这样，就可以对写入的流进行处理，并得到相应的文件了。

libCurl库的好处是使用简单的C语言函数调用为FTP、HTTP、TELNET等标准网络协议提供了发送和接收数据的简单接口。知道如何使用这些标准网络函数库，可以大大节约开发的时间。