1.DMA技术
为什么要有 DMA 技术?
在没有DMA技术前,I/O的过程是这样的:
CPU发出对应的指令给磁盘控制器,然后返回;
磁盘控制器收到指令后,于是就开始准备数据,会把数据放入到磁盘控制器的内部缓冲区内,然后产生一个中断;
CPU收到中断信号后,停下手头的工作,接着把磁盘控制器的缓冲区的数据一次一个字节地进自己的寄存器,然后把寄存器里的数据写入到内存,而在数据传输的期间CPU是无法执行其他任务的,如下图所示:
可以看到:整个数据的传输过程,都要需要CPU亲自参与搬运数据的过程,而且这个过程,CPU是不能做其他事情的。简单的搬运几个字符数据那没问题,但如果我们用千兆网卡或硬盘传输大量数据的时候,都用CPU来搬运的话,肯定忙不过来。 于是就有DMA技术也就是在直接内存访问技术。
如下图DMA控制器进行数据传输的过程 具体流程:
1.用户进程调用read方法,向操作系统发出I/O请求,请求读取数据到自己的内存缓冲区中,进程进入阻塞状态;
2.操作系统收到请求后,进一步将I/O请求发送DMA,然后让CPU执行其他任务
3.DMA进一步将I/O请求发送给磁盘
4.磁盘收到DMA的I/O请求,把数据从磁盘读取到磁盘控制器的缓冲区中,当磁盘控制器的缓冲区被读满后,向DMA发起中断信号,告知自己缓冲区已满
5.DMA收到磁盘的信号,jiangvipan控制器缓冲区中的数据拷贝到内核缓冲区中,此时不占用CPU,CPU可以执行其他任务
6.当DMA读取了足够多的数据,就会发送中断信号给CPU
7.CPU收到DMA的信号,知道数据已经准备好,于是将数据从内核拷贝到用户空间,系统调用返回
可以看到,CPU不再参与 将数据从磁盘控制器缓冲区搬运到内核空间的工作,这部分工作全程由DMA完成。但是CPU在这个过程也是必不可少的,因为传输什么数据,从哪里传输到哪里,都需要CPU来告诉DMA控制器。
早起DMA只存在在主板中,如今有意I/O设备越来越多,数据传输的需求也不尽相同,所以每个I/O设备里面都有自己的DMA控制器
2.如何实现零拷贝
1. mmap + write
- 原理:利用内存映射(
mmap
)将内核缓冲区与用户空间映射到同一物理内存,省去一次拷贝。 - 流程:
- 磁盘 → 内核缓冲区(DMA);
- 用户进程通过
mmap
直接操作内核缓冲区; - 内核缓冲区 → Socket缓冲区(CPU拷贝);
- Socket缓冲区 → 网卡(DMA)。
- 优化效果:减少1次CPU拷贝(共3次拷贝)。
2. sendfile系统调用
- 原理:通过
sendfile
系统调用直接在内核中完成数据传输,无需用户空间参与。 - 流程:
- 磁盘 → 内核缓冲区(DMA);
- 内核缓冲区 → Socket缓冲区(CPU拷贝);
- Socket缓冲区 → 网卡(DMA)。
- 优化效果:减少2次上下文切换 + 1次CPU拷贝(共2次拷贝)。
3. 支持DMA的sendfile(SG-DMA)
- 原理:借助DMA引擎的“分散-收集”功能,直接从内核缓冲区传输到网卡。
- 流程:
- 磁盘 → 内核缓冲区(DMA);
- 内核缓冲区 → 网卡(DMA)。
- 优化效果:完全消除CPU拷贝(仅2次DMA拷贝)