F407 的 UART 串口收发实战

最新推荐文章于 2025-12-08 15:08:07 发布

原创最新推荐文章于 2025-12-08 15:08:07 发布 · 916 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#STM32F407 #UART #DMA

AI助手已提取文章相关产品：

串口不玄学：在 STM32F407 上把 UART 玩出花来 🛠️

你有没有过这样的经历？
明明代码写得“天衣无缝”，烧进去一运行，串口就是没输出——要么是乱码满屏飞，要么干脆静如止水。换根线试试？还是不行。重启电脑？也没用。最后发现：哦，原来 TX 和 RX 接反了 😅。

别笑，这事儿我干过三次，每次都觉得自己像个天才。

但今天咱们不讲这些入门级翻车现场，我们要深入一点： 怎么让 STM32F407 的 UART 不只是“能用”，而是“稳如老狗”、“快得离谱”、“扩展性强到可以当通信中枢”的存在 ？

毕竟，在真实项目里，UART 可不只是用来打印 printf("Hello World\n"); 的。它可能是你和 GPS 模块对话的唯一通道，是你升级固件的生命线，甚至是你整个设备对外发声的嘴巴。

从一个最常见的问题说起：为什么我的数据丢了？💥

想象一下这个场景：

你的 F407 正通过 USART1 接收来自 ESP8266 的 Wi-Fi 数据流。每秒发个几百字节，看着不多对吧？可突然有一天，用户反馈：“连不上服务器！” 查日志发现，关键的 AT 命令响应被截断了。

你以为是模块问题？其实是你自己掉坑里了。

根本原因就两个字： 溢出（Overrun） 。

当你用轮询方式读取 DR 寄存器时，如果 CPU 正在处理别的任务（比如算 PID、刷屏幕），下一帧数据就已经来了。硬件还没来得及通知你“我收到新数据啦！”，新的起始位又到了——这时候，ORE 标志就被置位了，旧数据直接被覆盖。

🔥 真相时刻 ：STM32 的 UART 接收只有一个缓冲区（RDR），不是 FIFO！
它不像某些高端芯片那样有 16 级深度 FIFO 来缓存 incoming 字节。一旦你不及时读走，后面来的数据就会把你拍死在沙滩上。

那怎么办？三条路：

中断 + 环形缓冲区 → 小流量够用
DMA 全接管接收 → 高频场景首选
外加硬件流控（RTS/CTS） → 最稳妥但需要对方支持

我们一个个来看。

中断驱动 + 环形缓冲：给 UART 装个“蓄水池”💧

最简单的改进方案，就是在中断里不做实际处理，只做一件事： 快速捞数据，扔进环形缓冲区 。

#define RX_BUFFER_SIZE 128
uint8_t rx_buffer[RX_BUFFER_SIZE];
volatile uint16_t rx_head = 0;  // 写指针
volatile uint16_t rx_tail = 0;  // 读指针

// 启动单字节中断接收
void uart_start_rx_interrupt(void) {
    HAL_UART_Receive_IT(&huart1, &rx_byte, 1);
}

// 中断回调函数
void HAL_UART_RxCpltCallback(UART_HandleTypeDef *huart) {
    if (huart == &huart1) {
        uint16_t next_head = (rx_head + 1) % RX_BUFFER_SIZE;
        if (next_head != rx_tail) {  // 缓冲未满
            rx_buffer[rx_head] = rx_byte;
            rx_head = next_head;
        }
        // 重新启动下一次接收
        HAL_UART_Receive_IT(huart, &rx_byte, 1);
    }
}

⚠️ 注意这里用了 volatile ，因为这两个变量会被 ISR 修改，必须防止编译器优化。

然后你在主循环里慢慢消费：

while (rx_tail != rx_head) {
    uint8_t data = rx_buffer[rx_tail];
    rx_tail = (rx_tail + 1) % RX_BUFFER_SIZE;

    // 处理数据：解析命令、转发到其他接口...
    process_uart_data(data);
}

✅ 优点：
- 实现简单，资源占用少
- 几乎杜绝丢包（只要中断优先级不太低）

❌ 缺点：
- 每个字节触发一次中断 → 高频通信时 CPU 开销大
- 如果中断嵌套深，仍可能延迟响应

所以，如果你要跑 921600bps 或更高波特率，或者同时接了好几个串口设备，这条路就不够看了。

DMA 接管一切：让 CPU 彻底躺平 🛌

DMA 是什么？是“Direct Memory Access”——直连内存访问。它的本质是： 让外设自己搬数据，不用烦 CPU 。

对于 UART 接收来说，DMA 可以做到：

设置一段内存作为接收缓冲区；
外设自动把每个收到的字节塞进去；
收满一半或全部时，才通知 CPU 一次；
CPU 起身干活，干完继续睡觉。

这就叫高效。

双缓冲 DMA 模式：无缝接力赛 🏁

STM32F407 的 DMA 支持 双缓冲（Double Buffer）模式 ，这是实现零丢失接收的终极武器。

配置如下：

#define DMA_RX_BUF_SIZE 64
uint8_t dma_rx_buf_a[DMA_RX_BUF_SIZE];
uint8_t dma_rx_buf_b[DMA_RX_BUF_SIZE];

// 启动双缓冲 DMA 接收
HAL_UART_Receive_DMA(&huart1, 
                     (uint8_t*)&dma_rx_buf_a, 
                     DMA_RX_BUF_SIZE);

// 启用双缓冲切换
__HAL_LINKDMA(&huart1, hdmarx, hdma_usart1);
hdma_usart1.Instance->CR |= DMA_SxCR_DBM;  // Double buffer mode enable

DMA 会先填满 A 缓冲区，然后自动切到 B，再回来 A……如此往复。每次切换都会触发中断：

HAL_UART_RxHalfCpltCallback() → A 填满了
HAL_UART_RxCpltCallback() → B 填满了

你只需要在这两个回调里把对应的数据拿走就行：

void HAL_UART_RxHalfCpltCallback(UART_HandleTypeDef *huart) {
    if (huart == &huart1) {
        parse_data(dma_rx_buf_a, DMA_RX_BUF_SIZE);  // 解析前半段
    }
}

void HAL_UART_RxCpltCallback(UART_HandleTypeDef *huart) {
    if (huart == &huart1) {
        parse_data(dma_rx_buf_b, DMA_RX_BUF_SIZE);  // 解析后半段
    }
}

🎯 效果如何？
CPU 几乎不参与搬运过程，中断频率降低为原来的 1/(缓冲区大小) 倍。原本每字节中断一次 → 现在每 64 字节才叫你一次。效率提升十倍不止！

💡 小贴士 ：
如果你担心突发大数据冲垮缓冲区，可以在解析函数中动态判断帧边界（比如遇到 \n 就截断），而不是等缓冲区填满才处理。

波特率到底该怎么算？别再靠运气了 🧮

很多人初始化 UART 的时候，直接抄例程里的 115200 ，从来没想过： 这个值真的准吗？

答案是：不一定。

STM32F407 的波特率由以下公式决定：

$$
BaudRate = \frac{f_{PCLK}}{8 \times (2 - OVER8) \times USARTDIV}
$$

其中：
- f_PCLK 是 APB 总线时钟（USART1 在 APB2，其余在 APB1）
- OVER8 是过采样模式（0=16倍，1=8倍）
- USARTDIV 是一个 12.4 位的分频系数（整数+小数）

HAL 库会自动帮你计算 BRR 寄存器值，但它不会告诉你误差有多大。

举个例子：

假设系统时钟 168MHz，APB2 分频为 2 → PCLK2 = 84MHz
你要设置 115200 波特率，使用 16 倍采样（OVER8=0）

那么理想 DIV 值为：

$$
DIV = \frac{84,000,000}{16 \times 115200} ≈ 45.568
$$

拆成整数部分 45，小数部分 0.568 × 16 ≈ 9 → 所以 BRR = 0x2D9

实际波特率是多少？

$$
\frac{84,000,000}{16 \times (45 + 9/16)} = \frac{84e6}{729} ≈ 115,226.3
$$

误差： (115226.3 - 115200)/115200 ≈ 0.023% —— 很小，没问题 ✅

但如果 PCLK 是 72MHz，而你要跑 921600bps：

$$
DIV = \frac{72,000,000}{16 \times 921600} ≈ 4.88
→ BRR = 0x4E → 实际波特率 ≈ 923077 → 误差高达 0.16%！

听着不大？但在长距离传输或晶振不准的情况下，累积误差可能导致帧错误。

📌 经验法则 ：
- 优先选择能让 DIV 成整数或接近整数的 PCLK；
- 使用 ST 提供的 STM32CubeMX 工具辅助计算；
- 若无法避免误差，尽量控制在 ±2% 以内；
- 对精度要求极高时，启用 8 倍过采样（OVER8=1） 可提高分辨率。

引脚配置的艺术：别让 GPIO 拖后腿 🎯

UART 再强，引脚配错了也是白搭。

常见错误包括：
- 忘记开时钟（RCC）
- 把 TX 配成了输入
- 没选对 AF 功能编号
- 多个 UART 共用同一组 GPIO 导致冲突

我们以 USART1 为例（PA9/TX, PA10/RX）来完整走一遍配置流程：

__HAL_RCC_GPIOA_CLK_ENABLE();  // 先开时钟！
__HAL_RCC_USART1_CLK_ENABLE();

GPIO_InitTypeDef gpio;

// 配置 PA9 为复用推挽输出
gpio.Pin   = GPIO_PIN_9;
gpio.Mode  = GPIO_MODE_AF_PP;           // 复用推挽
gpio.Speed = GPIO_SPEED_FREQ_VERY_HIGH;  // 高速模式
gpio.Alternate = GPIO_AF7_USART1;       // AF7 对应 USART1
HAL_GPIO_Init(GPIOA, &gpio);

// 配置 PA10 为浮空输入（也可以上拉）
gpio.Pin   = GPIO_PIN_10;
gpio.Mode  = GPIO_MODE_INPUT;
gpio.Pull  = GPIO_PULLUP;               // 建议上拉防干扰
HAL_GPIO_Init(GPIOA, &gpio);

✅ 最佳实践建议 ：
- 所有 UART TX 引脚都设为 复用推挽输出
- RX 引脚推荐 上拉输入 ，避免空闲时电平浮动引发误触发
- 使用 GPIO_SPEED_FREQ_VERY_HIGH 提升边沿陡度，适合高速通信
- 多个 UART 并行工作时，注意不要共用同一个 GPIOx_AFRH/AFRL 寄存器位

还有一点容易忽略： 重映射功能 。

比如你想把 USART3 改到 PC10/PC11，而不是默认的 PB10/PB11，就得开启 SYSCFG 时钟并配置 AFIO：

__HAL_RCC_SYSCFG_CLK_ENABLE();
__HAL_RCC_USART3_CLK_ENABLE();

// 将 USART3 映射到 PC10/PC11
__HAL_AFIO_REMAP_USART3_ENABLE();  // 注意：F407 需查手册确认是否支持

不过更现代的做法是直接查《Datasheet》看哪些引脚原生支持该 AF 功能，避免使用老旧的 remap 机制。

实战案例：构建一个多串口通信框架 🧱

现在我们来玩点大的： 在一个 F407 上同时管理 4 路 UART 设备 。

设想这样一个系统：

UART 接口	连接设备	功能
USART1	上位机	调试 / 固件升级
USART2	ESP32-WiFi	接入 MQTT
USART3	GPS 模块	获取经纬度
UART4	HMI 触摸屏	用户交互

目标：各自独立运行，互不干扰，且都能稳定收发。

架构设计思路

每个 UART 独立使用 DMA 接收 + 中断发送
发送采用阻塞式（短消息）或队列异步发送（高频）
所有接收数据统一进入环形缓冲区
主循环中定时扫描各缓冲区，按协议解析

初始化封装

typedef struct {
    UART_HandleTypeDef huart;
    DMA_HandleTypeDef  hdma_rx;
    uint8_t            rx_dma_buf[2][64];  // 双缓冲
    RingBuffer         app_rx_buf;         // 应用层缓冲
    uint8_t            tx_busy;
} UartDevice;

UartDevice dev_usart1, dev_usart2, dev_usart3, dev_uart4;

初始化函数示例（以 USART1 为例）：

void init_usart1(void) {
    dev_usart1.huart.Instance = USART1;
    dev_usart1.huart.Init.BaudRate = 115200;
    dev_usart1.huart.Init.WordLength = UART_WORDLENGTH_8B;
    dev_usart1.huart.Init.StopBits = UART_STOPBITS_1;
    dev_usart1.huart.Init.Parity = UART_PARITY_NONE;
    dev_usart1.huart.Init.Mode = UART_MODE_TX_RX;
    dev_usart1.huart.Init.HwFlowCtl = UART_HWCONTROL_NONE;
    dev_usart1.huart.Init.OverSampling = UART_OVERSAMPLING_16;

    HAL_UART_Init(&dev_usart1.huart);

    // 配置 DMA
    __HAL_LINKDMA(&dev_usart1.huart, hdmarx, dev_usart1.hdma_rx);
    dev_usart1.hdma_rx.Instance = DMA2_Stream2;
    dev_usart1.hdma_rx.Init.Channel = DMA_CHANNEL_4;
    dev_usart1.hdma_rx.Init.Direction = DMA_PERIPH_TO_MEMORY;
    dev_usart1.hdma_rx.Init.PeriphInc = DMA_PINC_DISABLE;
    dev_usart1.hdma_rx.Init.MemInc = DMA_MINC_ENABLE;
    dev_usart1.hdma_rx.Init.PeriphDataAlignment = DMA_PDATAALIGN_BYTE;
    dev_usart1.hdma_rx.Init.MemDataAlignment = DMA_MDATAALIGN_BYTE;
    dev_usart1.hdma_rx.Init.Mode = DMA_CIRCULAR;  // 循环模式
    dev_usart1.hdma_rx.Init.Priority = DMA_PRIORITY_LOW;

    HAL_DMA_Init(&dev_usart1.hdma_rx);

    // 启动双缓冲 DMA 接收
    HAL_UART_Receive_DMA(&dev_usart1.huart, 
                         dev_usart1.rx_dma_buf[0], 
                         64);
    ((DMA_Stream_TypeDef*)dev_usart1.hdma_rx.Instance)->CR |= DMA_SxCR_DBM;

    // 初始化应用缓冲区
    ringbuf_init(&dev_usart1.app_rx_buf);
}

数据消费逻辑

在主循环中定期检查：

void task_uart_poll(void) {
    // 检查 USART1
    while (!ringbuf_is_empty(&dev_usart1.app_rx_buf)) {
        uint8_t ch;
        ringbuf_pop(&dev_usart1.app_rx_buf, &ch);
        handle_debug_cmd(ch);  // 处理调试命令
    }

    // 检查 GPS 数据
    while (!ringbuf_is_empty(&dev_usart3.app_rx_buf)) {
        uint8_t ch;
        ringbuf_pop(&dev_usart3.app_rx_buf, &ch);
        gps_parser_feed(&gps_parser, ch);  // NMEA 解析
    }

    // ...其他设备
}

这样做的好处是：

解耦：物理层与应用层分离
可扩展 ：新增一个 UART 只需复制结构体 + 初始化函数
稳定性高 ：DMA 保证接收不丢包，中断不影响主流程

那些年踩过的坑：血泪总结 💣

1. 地线没接好 → 通信像抽风

现象：短距离正常，稍微拉长线就乱码。
真相：没有共地，信号参考电平漂移。

✅ 解法：务必确保两端 GND 相连。超过 1 米建议用带屏蔽层的双绞线，并将屏蔽层单点接地。

2. 电平不匹配 → 模块直接罢工

TTL vs RS232？很多人搞混。

类型	电压范围	是否常用
TTL	0V / 3.3V	✅ MCU 直出
RS232	±3~±15V（负逻辑）	❌ 需 MAX3232 转换

直接拿 TTL 去接 RS232 设备？轻则无响应，重则烧毁 IO！

📌 记住一句话： MCU 出来的是 TTL，接 PC 一定要转 USB-TTL 模块！

3. 中断优先级打架 → 小消息永远抢不到 CPU

多个 UART 同时工作时，若都设为相同优先级，低频但重要的指令（如“关机”命令）可能被高频 GPS 数据淹没。

✅ 正确做法：

HAL_NVIC_SetPriority(USART1_IRQn, 1, 0);  // 调试口优先级高
HAL_NVIC_SetPriority(USART3_IRQn, 3, 0);  // GPS 优先级低

根据业务重要性分级，避免“信息饥饿”。

4. 忘记清除错误标志 → ORE 持续报错

有时候你会发现：明明数据收到了，但 HAL_UART_GetState() 返回错误状态。

原因：发生过一次溢出（ORE），但你没手动清除标志位。

正确清除方法：

__HAL_UART_CLEAR_FLAG(&huart1, UART_FLAG_ORE);
__HAL_UART_CLEAR_FLAG(&huart1, UART_FLAG_FE);
__HAL_UART_CLEAR_FLAG(&huart1, UART_FLAG_NE);

建议在中断服务程序开头加一句：

if (__HAL_UART_GET_FLAG(&huart1, UART_FLAG_ORE)) {
    __HAL_UART_CLEAR_FLAG(&huart1, UART_FLAG_ORE);
    // 可记录日志：发生溢出，需优化接收逻辑
}

发送也能很优雅：异步队列了解一下 🚀

前面我们一直用 HAL_UART_Transmit() 发送，它是阻塞式的，传不完就不返回。

但在多任务系统中，这显然不合适——你总不能为了发个 "ACK\n" 让整个系统卡住几十毫秒吧？

解决方案： 异步发送队列 + TXE 中断驱动

思路很简单：

定义一个发送缓冲区和 FIFO 队列；
当调用 uart_send_async() 时，数据先进队列；
如果当前空闲，触发第一个字节发送；
每次 TXE 中断自动发下一个字节，直到队列为空。

代码骨架如下：

typedef struct {
    uint8_t buf[128];
    uint16_t head, tail;
    uint8_t busy;
} TxQueue;

TxQueue uart1_txq;

void uart_send_async(uint8_t *data, uint16_t len) {
    for (int i = 0; i < len; i++) {
        uint16_t next = (uart1_txq.head + 1) % 128;
        if (next == uart1_txq.tail) break;  // 满了
        uart1_txq.buf[uart1_txq.head] = data[i];
        uart1_txq.head = next;
    }

    if (!uart1_txq.busy) {
        // 启动发送
        uint8_t byte = uart1_txq.buf[uart1_txq.tail];
        uart1_txq.tail = (uart1_txq.tail + 1) % 128;
        uart1_txq.busy = 1;
        huart1.Instance->DR = byte;
        __HAL_UART_ENABLE_IT(&huart1, UART_IT_TXE);  // 开启 TXE 中断
    }
}

// 在 USART1_IRQHandler 中处理
void USART1_IRQHandler(void) {
    if (__HAL_UART_GET_FLAG(&huart1, UART_FLAG_TXE)) {
        if (uart1_txq.head != uart1_txq.tail) {
            uint8_t byte = uart1_txq.buf[uart1_txq.tail];
            uart1_txq.tail = (uart1_txq.tail + 1) % 128;
            huart1.Instance->DR = byte;
        } else {
            uart1_txq.busy = 0;
            __HAL_UART_DISABLE_IT(&huart1, UART_IT_TXE);
        }
    }
}

从此以后，发送再也不怕阻塞主流程了！