Python3中使用零拷贝技术来提高网络文件传输时的系统吞吐量

首先,推荐一篇好文,这篇文章细致地描述了零拷贝技术的原理,以及其与传统拷贝过程的区别:http://www.linuxjournal.com/article/6345?page=0,0


从总体上来简单总结一下零拷贝技术可以通过对比来理解:


传统的拷贝过程大致是这样一个过程:

1. 通过直接内存访问数据进入操作系统内核的缓存(数据拷贝到内核空间)——CPU将数据拷贝到用户空间——CPU将数据写入到套接字缓存——内存直接访问拷贝发送数据;

零拷贝技术的过程是这样的:

2. 通过直接内存访问数据进入操作系统内核缓存(数据拷贝到内核空间)——CPU直接调用sendfie系统调用直接将内核缓存拷贝到套接字缓存——内存直接访问拷贝发送数据;甚至通过进一步的优化,内核之内的那次数据复制也可以省掉,这是通过将内核缓存的相关信息传递给套结字缓存,系统利用这些信息直接读取内核缓存发送数据。


至于具体效果如何,可以使用Python3提供的相关系统调用的封装来测试对比一下。


首先,要实现一个简单的文件接收服务器,实现起来非常简单(zerocopyserver.py):

'''
Created on Aug 28, 2015

@author: felix
'''

import socket
import hashlib
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
server_address = ('0.0.0.0', 10000)
print('starting up on %s port %s' % server_address)
sock.bind(server_address)
sock.listen(1)

while True:
    print('Waiting for a connection')
    connection, client_address = sock.accept()
    size = 0
    try:
        i = 0
        while True:
            data = connection.recv(65536)
            #print('Received data: "%s"' % data)
            i += 1
            if data:
                size += len(data)
                #print(data)
                #cnt += data
                if i % 10000 == 0:
                    print('Current loop: ', i)
                #print('[%s]' % data)
            else:
                print('Done!')
                break
        print('I:', i)
        print('Total size: ', size)
        #print('Hash of received data :', hashlib.md5(cnt).hexdigest())
    finally:
        connection.close()

可以看到,我们统计了最终收到的数据的大小,以判断两种方式发送的文件是否是相同的。

下面是传统的拷贝文件的程序:copyclient.py

'''
Created on Aug 29, 2015

@author: felix
'''
import socket
import time

sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
server_address = ('127.0.0.1', 10000)
sock.connect(server_address)

start = time.time()
try:
    with open(r'/home/felix/Downloads/Forrest.Gump.1994.1080p.BluRay.x264.anoXmous/Forrest.Gump.1994.1080p.BluRay.x264.anoXmous_.mp4', 'rb') as f:
        message = f.read()
        sock.sendall(message)
finally:
    sock.close()

end = time.time()
print('Total time: ', end-start)

下面是使用零拷贝实现的版本zerocopyclient.py

'''
Created on Aug 29, 2015

@author: felix
'''
import os
import socket
import time

sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
server_address = ('127.0.0.1', 10000)
sock.connect(server_address)

start = time.time()
try:
    with open(r'/home/felix/Downloads/Forrest.Gump.1994.1080p.BluRay.x264.anoXmous/Forrest.Gump.1994.1080p.BluRay.x264.anoXmous_.mp4', 'rb') as f:
        #message = f.read()
        #sock.sendall(message)
        ret = 0
        offset = 0

        while True:
            ret = os.sendfile(sock.fileno(),  f.fileno(), offset, 65536)
            offset += ret
            if ret == 0:
                break
finally:
    sock.close()

end = time.time()
print('Total time: ', end-start)

在启动文件接收服务之后,我们就可以分别来测试两种传输方式的差别了:

copyclient.pyzerocopyclient.py
Total time:  1.2538435459136963Total time:  0.5658297538757324
Total time:  1.0714919567108154Total time:  0.5623219013214111

可以明显看到,同样传输2.4GB的数据,使用零拷贝技术的客户端所消耗的时间要比传统的拷贝方式更快一些。由于是本机测试,没有经过物理网卡,如果经过网卡的话,总的传输时间会受限于网卡的传输速度。


这样,对于只需要传输文件,而不用用户程序去处理文件内容的情况下,这种零拷贝技术能够极大提高本机的吞吐量,如果这样的拷贝操作非常频繁的话,通过零拷贝优化还是可以省出可观的时间的,同时也节省了CPU的时钟周期(可以用来做其它事情)。

PS:请使用Python3来运行以上的测试程序;在测试开始前先启动测试的文件接收服务(zerocopyserver.py);零拷贝技术需要系统内核支持(>=2.4.19),故测试之前请确认系统版本是否支持零拷贝系统调用。

### 什么是零拷贝 零拷贝Zero-Copy)是一种旨在提升数据传输效率的技术,其核心理念在于减少 CPU 和内存资源的消耗,在数据传输过程中尽可能避免用户空间与内核空间之间的多次复制操作[^2]。 传统数据传输方式通常涉及多个步骤的数据移动过程:首先将数据从磁盘读入到内核缓冲区,再由内核缓冲区复制到用户态缓冲区;随后通过网络接口卡(NIC),再次将数据从用户态缓冲区写回到内核缓冲区并发送至目标位置。这种多步复制不仅增加了 CPU 负载,还可能导致较高的延迟和较差的吞吐量表现。 相比之下,零拷贝技术能够显著简化上述流程。它允许操作系统直接利用底层硬件功能或特定机制来完成高效的数据传递,例如借助 DMA 控制器直接把文件内容加载进页缓存(Page Cache),并通过 mmap 映射等方式供上层程序访问而无需额外搬运动作发生于不同存储层次间[^4]。 ### 技术原理 具体而言,零拷贝主要依赖以下几个关键技术点: #### 页面缓存 (Page Cache) Linux 文件系统维护了一个统一的页面高速缓存结构用来保存最近使用的磁盘块副本以便快速检索重用它们而不是每次都重新请求物理介质上的原始资料。当执行某些类型的IO操作(如sendfile()),可以跳过常规路径中的部分环节,使得源端可以直接指向已存在的page cache条目而非经历完整的read/write链条转换. #### Scatter/Gather I/O 散列收集(SG表)方法让单次调用能处理来自连续逻辑地址但实际分布不连贯的一组缓冲片段集合;这样即使输入输出对象并非严格意义上的单一整块也可以被当作整体对待进而减少了分片带来的管理开销以及潜在边界调整需求. #### Direct Memory Access (DMA) 现代计算机体系架构下的外设控制器具备独立寻址能力即所谓的直接内存访问(DMA),它可以绕过CPU主动参与搬运工作自行完成大容量数据搬移任务从而解放处理器去做其他更重要的事情去提高整个系统的并发性能水平. ### 应用场景 由于这些优势的存在,因此零拷贝非常适合应用于如下领域: - **高性能服务器开发**: 如Nginx、Netty等知名开源项目内部均不同程度采纳了该策略以达成更优的服务质量指标. - **大数据处理平台构建**: Hadoop YARN ResourceManager负责调度作业期间也会运用类似的思路优化节点间通讯成本降低带宽压力促进集群扩展性增强效果明显可见一斑.[^3] - **实流媒体服务提供者**: 对音视频素材实施即编码解码变换后再推送给客户端观看体验流畅度至关重要此采用zero-copy手段无疑有助于缓解瓶颈制约因素影响程度达到事半功倍之效[^1]. ```python import os from socket import * def zero_copy_send(file_path, sock): with open(file_path, 'rb') as f: while True: buf = bytearray(os.sendfile(sock.fileno(), f.fileno(), None, 8192)) if not buf: break ``` 以上是一个简单的 Python 实现例子展示了如何基于 `os.sendfile` 函数实现零拷贝发送文件的功能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值