那么如何把套接字和文件联系起来呢? 答案就是通过下面这张图。

其中task_struct表示一个进程,files_struct中的fd_array[]表示该进程打开的所有描述符,对于套接字来说,与其他类型文件的区别就是最终f_op指向的是socket_file_ops。不过,可以看到,这里的socket_file_ops只有一些通用的操作,并没有send和recv。特有的操作通过 socketcall() 区分的。
socket 和 sock
终于到今天的主角了。实际上,对每一个新创建的套接字,内核协议栈都会创建struct socket和struct sock两个数据结构。这两个结构就像孪生兄弟,struct socket面向用户空间,struct sock面向内核空间。
struct socket简化版的结构如下
其中task_struct表示一个进程,files_struct中的fd_array[]表示该进程打开的所有描述符,对于套接字来说,与其他类型文件的区别就是最终f_op指向的是socket_file_ops。不过,可以看到,这里的socket_file_ops只有一些通用的操作,并没有send和recv。特有的操作通过 socketcall() 区分的。
socket 和 sock
终于到今天的主角了。实际上,对每一个新创建的套接字,内核协议栈都会创建struct socket和struct sock两个数据结构。这两个结构就像孪生兄弟,struct socket面向用户空间,struct sock面向内核空间。
struct socket
struct socket简化版的结构如下
<net.h> struct socket {
unsigned long flags;
const struct proto_ops *ops;
struct file *file;
struct sock *sk;
short type; };
其中type表示协议,这是在创建套接字的时候的protocol参数确定的
int socket(int domain, int type, int protocol);
file指针指向上面那张图中的struct file结构,通过它,socket便与文件系统关联了起来。sk指向孪生的兄弟sock结构。socket结构中最重要的要数ops指针了,根据协议类型,它指向一种特定协议的实现。比如TCP的就是inet_stream_ops,ICMP、UDP协议对应inet_dgram_ops,RAWIP对应的是inet_sockraw_ops同样地,这些也都在创建套接字的时候就决定了。struct proto_ops的简化版本的结构如下
<net.h> struct proto_ops{ int family;
int (*bind)(struct socket *sock, struct sockaddr *myaddr, int sockaddr_len);
int (*connect)(struct socket *sock,struct sockaddr *vaddr,int sockaddr_len, int flags);
int (*accept)(struct socket *sock, struct socket *newsock, int flags);
int (*sendmsg)(struct socket *sock, struct msghdr *m, size_t total_len);
}
其中的接口名字是不是很熟悉?是的,它们和进行网络编程时调用的C库中函数名字是一样的。以sendmsg为例,真实的调用过程是这样

即当用户调用sendmsg时,内核会找到描述符fd对应的struct socket结构,然后调用sock->ops->sendmsg执行特定协议的发送。
那么,ops字段什么时候被赋值呢?答案是,在创建struct sock结构前。
struct sock的简化结构如下图所示
struct sock_common {
struct proto *skc_prot;
};
struct sock {
struct sock_common __sk_common;
struct sk_buff_head sk_receive_queue;
struct sk_buff_head sk_write_queue;
};
其中最重要的字段就是skc_prot,它也是协议相关的。作为struct socket结构的孪生兄弟,struct sock结构也是在用户创建套接字时就创建的

sock_alloc创建了struct socket结构,随后,根据用户传入的family,查询数组net_families,找到对应的函数指针,调用create.
net_families保存着内核启动时注册(通过sock_register)的 socket protocol handler,比如以下几种:
static const struct net_proto_family inet_family_ops = { .family = PF_INET, .create = inet_create, .owner = THIS_MODULE, }; static const struct net_proto_family netlink_family_ops = { .family = PF_NETLINK, .create = netlink_create, .owner = THIS_MODULE, /* for consistency 8) */ }; static const struct net_proto_family packet_family_ops = { .family = PF_PACKET, .create = packet_create, .owner = THIS_MODULE, }; static const struct net_proto_family unix_family_ops = { .family = PF_UNIX, .create = unix_create, .owner = THIS_MODULE,, };

inetsw中注册的每种协议都有ops和prot两个字段,前者与struct socket结构关联到一起,后者与struct sock关联到一起。在inet_create中,struct socket的ops字段和struct sock的sk_prot字段被赋值。
以我们创建的套接字类型是TCP为例,此时struct socket和struct sock的关系如下
本文深入探讨了Linux系统中套接字与文件系统的内在联系,解释了套接字如何通过描述符与文件系统关联,以及socket_file_ops在其中的作用。通过structsocket和structsock两个核心数据结构,详细阐述了套接字的内部机制,包括协议类型的确定、特定协议操作的执行,以及socketcall()函数在区分特有操作中的关键作用。
976

被折叠的 条评论
为什么被折叠?



