dma_addr_t与流式映射和一致性映射

最新推荐文章于 2025-09-16 20:02:50 发布

原创最新推荐文章于 2025-09-16 20:02:50 发布 · 5.6k 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#struct #allocation #buffer #cmd #工作 #list

设备内存专栏收录该内容

19 篇文章

订阅专栏

DMA映射在设备驱动中至关重要，涉及到一致性映射和流式映射。dma_alloc_coherent用于一致性映射，dma_map_single用于流式映射。一致性映射的内存分配和释放涉及dma_pool_create和dma_pool_destroy。流式映射需要指定数据流向，如DMA_TO_DEVICE或DMA_FROM_DEVICE。此外，针对不同场景，如单页和分散/聚集映射，有不同的映射和解映射函数。驱动程序在使用DMA时需要注意缓冲区的访问权限和同步问题。

DMA映射

一个DMA映射是要分配的DMA缓冲区与为该缓冲区生成的、设备可访问地址的组合。DMA映射建立了一个新的结构类型---dma_addr_t来表示总线地址。dma_addr_t类型的变量对驱动程序是不透明的，唯一允许的操作是将它们传递给DMA支持例程以及设备本身。

根据DMA缓冲区期望保留的时间长短，PCI代码有两种DMA映射:
1)一致性映射
2)流式DMA映射(推荐)

********************************************************************************************************

建立一致性DMA映射

********************************************************************************************************

void *dma_alloc_coherent(struct device *dev,size_t size,dma_addr_t *dma_handle,int flag);
该函数处理了缓冲区的分配和映射。

前两个参数是device结构和所需缓冲区的大小。
函数在两处返回结果：
1)函数的返回值是缓冲区的内核虚拟地址，可以被驱动程序使用。
2)相关的总线地址则保存在dma_handle中。

向系统返回缓冲区--解除一致性映射
void dma_free_coherent(struct device *dev,size_t size,void *vaddr,dma_addr_t dma_handle);

---------
DMA池

DMA池是一个生成小型、一致性DMA映射的机制。调用dma_alloc_coherent函数获得的映射，可能其最小大小为单个页。如果设备需要的DMA区域比这还小，就要用DMA池了。

struct dma_pool *dma_pool_create(const char *name,struct device *dev,size_t size,size_t align,size_t allocation);
name是DMA池的名字，dev是device结构，size是从该池中分配的缓冲区大小，
align是该池分配操作所必须遵守的硬件对齐原则。
销毁DMA池
void dma_pool_destroy(struct dma_pool *pool);

DMA池分配内存
void *dma_pool_alloc(struct dma_pool *pool,int mem_flags,dma_addr_t *handle);
释放内存
void dma_pool_free(struct dma_pool *pool,void *vaddr,dma_addr_t addr);

********************************************************************************************************

建立流式DMA映射

********************************************************************************************************

流式映射具有比一致性映射更为复杂的接口。这些映射希望能与已经由驱动程序分配的缓冲区协同工作，因而不得不处理那些不是它们选择的地址。

当建立流式映射时，必须告诉内核数据流动的方向。
枚举类型dma_data_direction:
DMA_TO_DEVICE 数据发送到设备(如write系统调用)
DMA_FROM_DEVICE 数据被发送到CPU
DMA_BIDIRECTIONAL 数据可双向移动
DMA_NONE 出于调试目的。

当只有一个缓冲区要被传输的时候，使用dma_map_single函数映射它:
dma_addr_t dma_map_single(struct device *dev,void *buffer,size_t size,enum dma_data_direction direction);
返回值是总线地址，可以把它传递给设备。

当传输完毕后，使用dma_unmap_single函数删除映射：
void dma_unmap_single(struct device *dev,dma_addr_t dma_addr,size_t size,enum dma_data_direction direction);

流式DMA映射的几条原则:
*）缓冲区只能用于这样的传送，即其传送方向匹配于映射时给定的方向。
*）一旦缓冲区被映射，它将属于设备，而不是处理器。
*）直到缓冲区被撤销映射前，驱动程序不能以任何方式访问其中的内容。
*）在DMA处于活动期间内，不能撤销对缓冲区映射，否则会严重破坏系统的稳定性。

驱动程序需要不经过撤销映射就访问流式DMA缓冲区的内容，有如下调用：
void dma_sync_single_for_cpu(struct device *dev,dma_handle_t bus_addr,size_t size,enum dma_data_direction direction);
将缓冲区所有权交还给设备：
void dma_sync_single_for_device(struct device *dev,dma_handle_t bus_addr,size_t size,enum dma_data_direction direction);

--------------------------
单页流式映射

有时候，要为page结构指针指向的缓冲区建立映射，比如
为get_user_pages获得的用户空间缓冲区。

dma_addr_t dma_map_page(struct device *dev,struct page *page,unsigned long offset,size_t size,enum dma_data_direction direction);
void dma_unmap_page(struct device *dev,dma_addr_t dma_address,size_t size,enum dma_data_direction direction);

---------------------------
分散/聚集映射

有几个缓冲区，它们需要与设备双向传输数据。可以简单地依次映射每一个缓冲区并且执行请求的操作，但是一次映射整个缓冲区表还是很有利的。

映射分散表的第一步是建立并填充一个描述被传输缓冲区的scatterlist结构的数组。
<linux/scatterlist.h>

scatterlist结构的成员：
struct page *page;
unsigned int length;
unsigned int offset;

映射
int dma_map_sg(struct device *dev,struct scatterlist *sg,int nents,enum dma_data_direction direction);
解除
void dma_unmap_sg(struct device *dev,struct scatterlsit *list,int nents,enum dma_data_direction direction);

--------------------------
PCI双重地址周期映射

通用DMA支持层使用32位总线地址，然而PCI总线还支持64位地址模式，即双重地址周期(DAC)。

<linux/pci.h>
通用DMA层并不支持该模式。

要使用PCI总线的DAC，必须设置一个单独的DMA掩码：
int pci_dac_set_dma_mask(struct pci_dev *pdev,u64 mask);

建立映射
dma64_addr_t pci_dac_page_to_dma(struct pci_dev *pdev,struct page *page,unsigned long offset,int direction);

-----------------------------
一个简单的PCI DMA例子

这里提供了一个PCI设备的DMA例子dad(DMA Acquisition Device)的一部分，说明如何使用DMA映射：

int dad_transfer(struct dad_dev *dev,int write,void *buffer,size_t count)
{
dma_addr_t bus_addr;

dev->dma_dir = (write ? DMA_TO_DEVICE : DMA_FROM_DEVICE);
dev->dma_size = count;

/*映射DMA需要的缓冲区*/
bus_addr = dma_map_single(&dev->pci_dev->dev,buffer,count,dev->dma_dir);

writeb(dev->registers.command,DAD_CMD_DISABLEDMA);
writeb(dev->registers.command,write ? DAD_CMD_WR : DAD_CMD_RD);
writeb(dev->registers.addr,cpu_to_le32(bus_addr)); /*设置*/
writeb(dev->registers.len,cpu_to_le32(count));

/*开始操作*/
writeb(dev->registers.command,DAD_CMD_ENABLEDMA);

return 0;
}
该函数映射了准备进行传输的缓冲区并且启动设备操作。

另一半工作必须在中断服务例程中完成，如：

void dad_interrupt(int irq,void *dev_id,struct pt_regs *regs)
{
struct dad_dev *dev = (struct dad_dev *)dev_id;

/* 确定中断是由对应的设备发来的*/

dma_unmap_single(dev->pci_dev->dev,dev->dma_addr,
dev->dma_size,dev->dma_dir);

/* 释放之后，才能访问缓冲区，把它拷贝给用户 */
...
}

-------------------------------------------------------------------
ISA设备的DMA

ISA总线允许两种DMA传输:本地DMA和ISA总线控制DMA。

只讨论本地(native)DMA。***********************非常重要!!!!!

本地DMA使用主板上的标准DMA控制器电路来驱动ISA总线上的信号线。

本地DMA，要关注三种实体：
*8237 DMA控制器(DMAC)
控制器保存了有关DMA传输的信息，如方向、内存地址、传输数据量大小等。
还包含了一个跟踪传送状态的计数器。
当控制器接收到一个DMA请求信号时，它将获得总线控制权并驱动信号线，
这样设备就能读写数据了。
*外围设备
当设备准备传送数据时，必须激活DMA请求信号。
DMAC负责管理实际的传输工作；当控制器选通设备后，
硬件设备就可以顺序地读/写总线上的数据。
当传输结束时，设备通常会产生一个中断。
*设备驱动程序
设备驱动程序完成的工作很少，
它只是负责提供DMA控制器的方向、总线地址、传输量的大小等。
它还与外围设备通信，做好传输数据的准备，当DMA传输完毕后，响应中断。

在PC中使用的早期DMA控制器能够管理四个“通道”，
每个通道都与一套DMA寄存器相关联。

DMA控制器是系统资源，因此，内核协助处理这一资源。

内核使用DMA注册表为DMA通道提供了请求/释放机制，
并且提供了一组函数在DMA控制器中配置通道信息。