数据复制:原理、问题与解决方案
在计算机领域,数据复制是一个常见但又容易被忽视的操作。想象一个办公室,每收到一封信,都要经过一系列繁琐的流程:先送到收发室,收发室打开信件,确定该信件所属的部门,并复印一份留作记录;然后交给安保部门,安保部门逐行检查信件,查看是否有工业间谍的迹象,同时也会复印一份信件以保留审计线索;最后,信件才会到达人事部门的收件人手中。这个过程听起来是不是很荒谬?然而,大多数Web服务器和计算机在处理收发消息时,也常常会进行大量不必要的数据复制。
1. 数据复制的原因及影响
在Web服务器处理GET请求时,会涉及一系列的数据传输过程。主要硬件包括CPU、内存总线、I/O总线、磁盘和网络适配器;主要软件包括Web服务器应用程序和内核,内核又包含文件系统和网络子系统。
从磁盘读取文件数据并通过网络适配器发送相应分段的过程中,通常会有四次数据复制:
1. 复制1(Copy 1) :文件通常先被读取到内核内存中的文件缓存区。这是一个不错的做法,因为后续对热门文件的请求可以直接从主内存中获取,避免了缓慢的磁盘I/O。
2. 复制2(Copy 2) :文件从文件缓存区复制到Web服务器应用程序缓冲区。由于应用程序缓冲区和文件缓存区位于主内存的不同部分,这个复制过程需要CPU通过内存总线从第一个内存位置读取数据,并写入第二个位置。
3. 复制3(Copy 3) :Web服务器执行write()操作将数据写入相应的套接字。由于应用程序在write()操作后可以随时重用或释放其缓冲区,内核中的网络子系统不能直接从应用程序缓冲区传输数据。因
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



