串口通信丢包？分析DMA缓冲区溢出原因

原创于 2025-12-07 10:13:52 发布 · 455 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#串口通信 #DMA #缓冲区溢出

AI助手已提取文章相关产品：

串口通信丢包？别急，先查DMA缓冲区是否“撑爆”了 💥

你有没有遇到过这种情况：明明硬件连接没问题，波特率也对得上，示波器上看数据波形清清楚楚，可收到的数据就是 少了一截、错位、甚至整包消失 ？

第一反应可能是线路干扰、时钟不准、驱动写错了……但排查一圈下来，发现真相往往藏在一个不起眼的地方—— DMA缓冲区溢出 。

是的，哪怕你已经用了DMA这种“高级货”，照样可能丢包。不是DMA不香，而是我们对它的理解还停留在“开了就万事大吉”的阶段。而现实是： DMA就像一辆自动搬运车，它搬得飞快，但如果你不及时清空仓库，迟早会堆满溢出。

今天我们就来撕开这层窗户纸，从工程实战角度，彻底讲明白：

为什么用了DMA还会丢包？
如何判断是不是DMA缓冲区在“背锅”？
怎么设计才能让串口通信稳如老狗？

DMA + UART 到底是怎么工作的？🧠

先别急着改代码，咱们得搞清楚这套组合拳的底层逻辑。

UART负责把串行数据一个字节一个字节地“吐”出来，而DMA的作用，就是当UART每收到一个字节时， 自动把它搬到内存里指定的位置 ，全程不需要CPU插手。

听起来很美好，对吧？CPU终于可以去干别的事了，比如处理协议、发网络请求、刷个RTOS任务调度……

但问题就出在这儿： DMA只管搬，不管清。

你可以把它想象成快递员——每天往你家门口堆箱子，一天两箱还好，但如果突然来个“618大促”，连续三天每天送50个包裹，而你一直没空拆，最后门口堆不下，新来的箱子只能压在旧的上面，或者直接被退回。

这就是 缓冲区溢出 的本质：生产速度 > 消费速度 → 数据被覆盖或丢弃。

那DMA到底是怎么“搬”的？

典型流程如下：

你提前划一块内存当“收件区”（比如 uint8_t rx_buf[256]; ）
启动DMA通道，告诉它：“UART一有数据，你就往这个buf里塞。”
数据来了，DMA自动搬运，直到填满256个字节
填满了，触发一个中断：“老板！货到了，快来提！”

这时候CPU才跳出来，在中断服务程序（ISR）里读走这256个字节，然后重新启动DMA，准备接下一波。

整个过程看似无缝，实则暗藏风险。

⚠️ 关键点： DMA一旦启动，就会按预设长度一直写下去。如果CPU没及时处理，下一轮数据就会从头开始写——老数据全没了。

为什么“开了DMA”还是丢包？🤔

很多开发者以为：“我用了DMA，就不该丢包。”
错！DMA只是提高了效率，并没有解决 流量匹配 的问题。

下面这几个场景，几乎每个嵌入式工程师都踩过坑：

场景一：传感器突然甩出一大坨数据 📈

假设你的设备通过串口接收图像片段，单帧最大512字节，波特率设的是460800bps。

你只开了256字节的DMA缓冲区，想着“够用”。

结果某次拍照，传感器一口气发了512字节。前256字节顺利进缓冲区，触发半满中断；但你的主控正在处理Wi-Fi连接，延迟了2ms——等CPU回过神，后256字节已经冲进来，把前面的覆盖了。

最终你拿到的是一段“前后拼接”的残缺数据，解析失败，日志里打一句：“Received invalid packet.”
然后就开始怀疑人生……

场景二：RTOS任务卡住，消费者“罢工”了 😤

你在系统里用了一个RTOS（比如FreeRTOS），DMA中断负责“投喂”数据，某个高优先级任务负责消费。

但某天这个消费任务因为等信号量、互斥锁、或者干脆死循环了，迟迟不读数据。

DMA这边可不管这些，照常搬运。缓冲区满了又满，数据一遍遍被刷新。

等到任务恢复，一看队列空空如也，或者全是陈年旧数据—— 这不是硬件问题，是系统级的资源竞争失控。

场景三：没开IDLE中断，靠“猜”帧边界 ❌

有些人为了省事，不用IDLE中断，而是靠定时器“隔一段时间看看有没有新数据”。

这叫“轮询式兜底”，听着稳妥，其实非常危险。

你想啊，如果对方发送间隔刚好卡在你的轮询周期之间呢？比如发完一包后停了10ms，而你每20ms查一次，那这一包就被漏掉了。

更糟的是，DMA缓冲区可能已经被下一包数据覆盖了，你连补救的机会都没有。

如何确认是DMA缓冲区溢出了？🔍

别瞎猜，要有证据。

方法一：看DMA计数器反推接收长度

STM32 HAL库里有个关键函数：

__HAL_DMA_GET_COUNTER(huart->hdmarx)

它能告诉你DMA还剩多少字节没搬完。假设你设了256字节缓冲区，现在计数器显示还有64字节没搬，说明已经搬了 256 - 64 = 192 字节。

但如果每次回调都发现实际接收长度远小于预期（比如应该收512，结果最多只拿到256），那基本可以断定： 缓冲区太小，数据被截断了。

方法二：加个溢出计数器 👀

在代码里埋个“监控探针”：

__IO uint32_t uart_overflow_count = 0;

void HAL_UART_ErrorCallback(UART_HandleTypeDef *huart) {
    if (__HAL_UART_GET_FLAG(huart, UART_FLAG_ORE)) { // 溢出错误标志
        __HAL_UART_CLEAR_FLAG(huart, UART_FLAG_ORE);
        uart_overflow_count++;
    }
}

只要看到 uart_overflow_count 在增长，说明UART硬件层已经检测到数据来不及处理，新的字节冲进来把旧的挤掉了——这是最直接的证据！

📌 注意：这个ORE（Overrun Error）标志是由UART外设自己报出来的，和DMA无关。也就是说，即使DMA还没填满，只要UART接收寄存器没被及时读走，也会触发ORE。

所以， ORE报警 ≠ DMA溢出，但它意味着“接收链路堵了” ，是预警信号。

真正靠谱的解决方案有哪些？🛠️

光发现问题不够，还得能解决。下面这几个方案，都是经过量产验证的“硬核打法”。

方案一：启用IDLE中断，抓住每一帧的尾巴 🎯

IDLE中断，全称“空闲线检测中断”（Idle Line Detection），是UART的一个隐藏神技。

它的原理很简单： 当串口线上连续一段时间没收到新数据（比如几个字符时间），就认为当前帧结束了，立刻触发中断。

这意味着你不再依赖“缓冲区满”才处理，而是 数据一停就响应 ，极大缩短延迟。

结合DMA使用，效果拔群。

实现方式（基于STM32 HAL）：

// 初始化时开启IDLE中断
__HAL_UART_ENABLE_IT(&huart2, UART_IT_IDLE);

// 在中断中判断是否为空闲中断
void USART2_IRQHandler(void) {
    if (__HAL_UART_GET_IT_SOURCE(&huart2, UART_IT_IDLE)) {
        // 清除中断标志（需先读SR再读DR）
        __HAL_UART_CLEAR_IT(&huart2, UART_CLEAR_IDLEF);

        // 获取已接收长度
        uint32_t pos = huart2.RxXferSize - __HAL_DMA_GET_COUNTER(huart2.hdmarx);

        // 处理数据
        ProcessReceivedData(uart_rx_buffer, pos);

        // 重启DMA
        HAL_UART_AbortReceive(&huart2);
        HAL_UART_Receive_DMA(&huart2, uart_rx_buffer, sizeof(uart_rx_buffer));
    }
}

✅ 优势：
- 不依赖固定帧长
- 响应快，适合变长报文
- 减少对缓冲区大小的依赖

⚠️ 注意事项：
- 必须在中断中先读SR再读DR，否则无法清除标志
- 如果数据流持续不断（如音频流），IDLE不会触发，需配合其他机制

方案二：双缓冲模式，实现“无缝切换” 🔁

有些高端MCU（如STM32H7/F7系列）支持DMA双缓冲模式（Double Buffer Mode）。简单说，就是准备两块缓冲区A和B，DMA轮流往里面写。

当A写满时，自动切换到B，同时通知CPU：“A满了，赶紧来取！”
等B写满，又切回A，如此往复。

这样做的好处是： 任何时候都有一块完整的数据等着你处理，不会因为处理慢而导致覆盖。

使用示例（HAL库）：

uint8_t buffer_a[256];
uint8_t buffer_b[256];

// 启动双缓冲接收
HAL_UARTEx_ReceiveToIdle_DMA(&huart2, buffer_a, buffer_b, 256);

// 回调函数中获取当前有效缓冲区
void HAL_UARTEx_RxEventCallback(UART_HandleTypeDef *huart, uint16_t Size) {
    if (huart == &huart2) {
        uint8_t* active_buf = (DMA_GetCurrentMemoryTarget(huart->hdmarx) == 0) ? 
                              buffer_a : buffer_b;
        ProcessReceivedData(active_buf, Size);
    }
}

✅ 优势：
- 硬件级切换，无数据丢失窗口
- 支持IDLE检测，精准捕获帧结束
- CPU处理时间更宽松

🚫 局限：
- 并非所有MCU支持（G0/G4等低端型号通常不支持）
- 占用双倍RAM

方案三：环形队列 + DMA搬运，打造“弹性仓库” 🌀

如果你的MCU不支持双缓冲，或者你想做更灵活的数据管理，可以用 环形队列 作为中间层。

思路是：DMA仍然使用固定缓冲区（如256字节），但每次DMA传输完成（HT或TC中断）时，把这一批数据 追加到一个更大的环形队列中 ，由后台任务慢慢消费。

#define RING_BUF_SIZE 1024
typedef struct {
    uint8_t buf[RING_BUF_SIZE];
    volatile uint16_t head;  // 写指针
    volatile uint16_t tail;  // 读指针
} ring_buffer_t;

ring_buffer_t g_uart_ring_buf;

int ring_buffer_put(ring_buffer_t *q, uint8_t *data, size_t len) {
    for (size_t i = 0; i < len; i++) {
        uint16_t next = (q->tail + 1) % RING_BUF_SIZE;
        if (next == q->head) {
            // 缓冲区满，丢弃最老数据（可选策略）
            q->head = (q->head + 1) % RING_BUF_SIZE;
        }
        q->buf[q->tail] = data[i];
        q->tail = next;
    }
    return len;
}

// 在DMA半传输/全传输中断中调用
void HAL_UART_RxCpltCallback(UART_HandleTypeDef *huart) {
    if (huart == &huart2) {
        uint32_t len = (huart->RxEventType == HAL_UART_RXEVENT_TC) ? 
                       256 : 128;  // TC:256, HT:128
        ring_buffer_put(&g_uart_ring_buf, uart_rx_buffer, len);
    }
}

✅ 优势：
- 容量大，抗突发能力强
- 解耦DMA与应用层处理
- 可配合多任务安全访问（加临界区或队列锁）

⚠️ 注意：
- 要防止多核/中断并发访问冲突
- 可设置溢出策略：丢弃旧数据 or 报警停止

方案四：硬件流控（RTS/CTS），从源头“刹车” 🛑

前面三种都是“被动防御”，而硬件流控是 主动控制发送方节奏 的终极手段。

原理很简单：

MCU通过 RTS （Request to Send）告诉对方：“我现在能不能收？”
当缓冲区使用超过阈值（比如80%），拉高RTS，表示“暂停发送”
处理完数据后，拉低RTS，恢复通信

这样，发送方就不会一股脑猛冲，造成接收端雪崩。

接线方式：

[发送设备]         [STM32]
   TX   ─────────→   RX
   RX   ←─────────   TX
   CTS  ←─────────   RTS
   RTS  ─────────→   CTS

✅ 建议：对于 > 230400bps 或数据突发性强的应用， 务必启用RTS/CTS 。

工程设计中的那些“血泪经验” 💡

说了这么多技术细节，最后分享几点我在实际项目中总结的“保命法则”：

1. 缓冲区大小 ≠ 越大越好，要“够用+冗余”

最小容量 ≥ 最长单帧数据 × 1.5
举例：最长帧512字节 → 建议缓冲区至少768~1024字节
RAM紧张时可用环形队列替代大缓冲

2. 中断优先级不能乱设

UART DMA中断建议设为 中高优先级
避免被低速任务（如LED扫描、按键检测）长时间阻塞
特别是在裸机系统中，别让一个while(1)拖垮整个通信

3. 日志监控很重要，加个“溢出计数器”保平安

__IO uint32_t g_uart_dma_overflow = 0;

// 在每次DMA重启前检查是否已被覆盖
if (__HAL_DMA_GET_COUNTER(huart->hdmarx) != 0) {
    // 表示DMA还没搬完就被重置了 → 肯定丢了数据
    g_uart_dma_overflow++;
}

现场调试时，通过串口输出这个计数器，一眼就能看出是否有问题。