Keil5中使用自定义scatter文件管理内存

原创于 2025-12-04 13:45:39 发布 · 325 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#scatter文件 #Keil5 #内存布局

AI助手已提取文章相关产品：

Keil5中自定义scatter文件的深度实践：从内存管理到系统架构

在嵌入式开发的世界里，你有没有遇到过这样的场景？明明算法已经优化得不能再优化了，但电机控制还是抖动；调试时发现某个变量莫名其妙被改写，查了半天原来是堆栈溢出覆盖了全局数据；OTA升级失败后设备变砖，只因为新固件的入口地址没对齐……这些问题背后，往往藏着一个被忽视的关键环节—— 内存布局 。

没错，就是那个藏在Keil“Options for Target”深处、大多数人选择“Use Memory Layout from Target Dialog”然后就再也不看一眼的链接配置。但当你开始接触高性能MCU（比如STM32H7、NXP i.MX RT系列）或构建复杂系统时，你会发现：默认的内存映射就像一件不合身的衣服，穿得久了不仅难受，还可能限制你的发挥。🚀

这时候， 自定义scatter文件 就成了你的“裁缝工具包”。它不只是决定代码放哪里那么简单，而是整个嵌入式系统的底层骨架设计图。今天我们就来彻底拆解这个“黑盒子”，看看如何用它打造更稳定、更快、更安全的嵌入式产品。💡

内存不止是RAM和Flash，它是性能与安全的战场

我们都知道MCU有Flash和SRAM，但这只是表面。现代高端MCU的存储体系远比这复杂得多：

ITCM（Instruction Tightly-Coupled Memory） ：指令紧耦合内存，CPU取指零等待，适合放中断向量表。
DTCM（Data Tightly-Coupled Memory） ：数据紧耦合内存，单周期访问，实时性要求高的变量放这里再合适不过。
AHB SRAM / BKPSRAM ：不同总线上的SRAM，有的支持DMA，有的掉电保持。
外部SDRAM / QSPI Flash ：容量大但访问慢，需要初始化才能用。

如果你把所有东西都往主SRAM里塞，那就像让所有人挤在同一个办公室——总线争抢、延迟飙升、冲突不断。而scatter文件的作用，就是给你一张蓝图，让你可以按角色分配工位：核心算法坐前排，日志缓存放角落，堆栈独立隔间……

举个真实案例 🛠️

某客户做工业PLC控制器，使用STM32H743。最初版本采用Keil默认布局，结果在现场测试时发现：当网络通信繁忙+高速脉冲输出同时进行时，偶尔会出现控制失步。

分析发现：
- 网络中断服务程序（ISR）和PWM定时器ISR共享同一块SRAM；
- 高频数据拷贝导致总线拥堵；
- 关键控制变量访问延迟波动极大。

解决方案？
👉 将PWM相关ISR和控制变量迁移到DTCM！

// 在代码中标记关键函数进入DTCM
__attribute__((section("DTCM_FUNC")))
void TIM8_UP_IRQHandler(void) {
    // 高速PWM更新逻辑
}

配合scatter文件：

LR_DTCM 0x20000000 0x00020000 {
    ER_DTCM_CODE 0x20000000 {
        *.o (DTCM_FUNC)
    }
}

效果立竿见影：中断响应时间从平均42μs降到16μs，最大抖动从±18μs缩小到±3μs，系统稳定性大幅提升 ✅

这就是精细内存管理的价值所在。

scatter文件的本质：链接器的“作战指令”

先别急着写语法，咱们先搞清楚一个问题： 为什么需要scatter文件？

默认布局的局限性 ⚠️

Keil MDK默认会根据你在“Target”页面填写的IROM1和IRAM1参数，自动生成一个隐式的scatter脚本。它的结构通常是这样的：

Load Region: IROM1 @ 0x08000000 → Execution Region: Code + RO Data
                             ↘ RW/ZI Data → IRAM1 @ 0x20000000

看起来挺好，对吧？但它有几个致命问题：

无法区分不同类型的SRAM
比如你有两个SRAM Bank，一个跑算法，一个专用于DMA缓冲区，它可不管你这些。
不能实现加载-执行分离
想把中断向量表复制到ITCM运行？默认方式做不到。
缺乏模块化与复用能力
多个项目之间很难共享一致的内存策略。
不利于高级功能扩展
Bootloader、MPU、TrustZone等高级特性都需要精确控制段分布。

所以，一旦你要做点“高级操作”，就必须接管控制权——也就是启用自定义scatter文件。

🔑 核心思想： scatter文件 = 内存地图 + 加载规则 + 运行时行为蓝图

散弹枪打鸟 vs 精准狙击：scatter的核心元素解析

要写好scatter文件，就得理解它的三个基本构件： 加载域（Load Region） 、 执行域（Execution Region） 和 输入段（Input Section） 。它们的关系有点像快递物流系统：

类比	实际含义
快递仓库（城市分拣中心）	加载域 —— 固件烧录后的存储位置
收货人地址（具体门牌号）	执行域 —— 程序运行时的真实位置
包裹内容（文件/衣物）	输入段 —— 编译生成的代码或数据节区

加载域（Load Region, LR）

代表程序在非易失性存储器中的存放区域，通常是Flash或者外部QSPI Flash。例如：

LR_IROM1 0x08000000 0x00100000 {    ; 起始地址0x08000000，大小1MB
    ...
}

注意：一个加载域可以包含多个执行域。比如你可以把一部分代码放在Flash里直接运行（XIP），另一部分数据需要从Flash复制到RAM才能使用。

执行域（Execution Region, ER）

描述程序运行时各段的实际物理地址。它可以和加载域相同（如XIP模式），也可以完全不同（如RW段加载到SRAM）。

ER_ITCM 0x00000000 0x00010000 {     ; 映射到ITCM RAM
    arm_itm.o(+RO)                  ; ITM调试日志函数放这里
}

输入段（Input Section）

来自编译器输出的目标文件中的节区，常见的有：

段名	属性	含义
`.text`	RO	可执行代码
`.rodata`	RO	只读数据（字符串常量、查找表）
`.data`	RW	已初始化的全局/静态变量
`.bss`	ZI	未初始化或清零变量
`.stack`	ZI	堆栈空间（某些环境下）

通过通配符匹配规则，把这些段分配到合适的执行域中。

实战语法手册：写出第一个有效的scatter文件

我们以STM32F407为例，一步步构建一个标准的基础scatter模板。

Step 1：取消GUI控制权

打开Keil → Project → Options for Target → Target
❌ 取消勾选 “Use Memory Layout from Target Dialog”

✅ 这一步非常重要！如果不取消，你写的scatter文件将被忽略！

Step 2：创建 `.sct` 文件并加入项目

新建文本文件 custom_memory.sct ，保存在项目目录下，然后右键添加到Keil工程中。

推荐路径结构：

project/
├── project.uvprojx
├── src/
│   ├── main.c
│   └── startup_stm32f407xx.s
└── linker/
    └── custom_memory.sct   ← 推荐放这里

Step 3：配置Linker引用

进入 Linker 选项卡 → 勾选 “Use Memory Layout File (.sct)”
填写路径： .\linker\custom_memory.sct

💡 提示：尽量用相对路径！避免绝对路径导致团队协作时找不到文件。

Step 4：编写基础scatter模板

; =====================================================
; custom_memory.sct - STM32F407ZGT6 内存布局
; 支持：512KB Flash, 128KB SRAM
; Author: Embedded Team
; Date: 2025-04-05
; =====================================================

LR_IROM1 0x08000000 0x00080000 {    ; Load Region: Flash 512KB
    ER_IROM1 0x08000000 0x00080000 { ; Execution Region in Flash
        *.o(RESET, +First)           ; 强制复位向量在最前面
        *(InRoot$$Sections)          ; __main等库函数所需
        *.o(Vectors)                 ; 中断向量表
        *(+RO)                       ; 其余只读段（.text, .rodata）
    }

    RW_IRAM1 0x20000000 0x00020000 { ; Execution Region in SRAM
        *(+RW +ZI)                   ; 所有读写和零初始化段
    }
}

关键点说明：

RESET, +First ：确保复位处理程序位于Flash起始处，这是ARM Cortex-M启动的基本要求。
*(InRoot$$Sections) ：CMSIS库使用的特殊符号，必须显式列出，否则链接报错。
*(+RO) ：捕获所有只读段，简洁高效。
*(+RW +ZI) ：兜底策略，防止遗漏段导致链接失败。

Step 5：验证是否生效

编译后查看生成的 .map 文件，在“Memory Map of the image”部分应该能看到类似内容：

Load Region LR_IROM1 (Base: 0x08000000, Size: 0x3a4, Max: 0x80000)
    Execution Region ER_IROM1 (Base: 0x08000000, Size: 0x39c)
    Execution Region RW_IRAM1 (Base: 0x20000000, Size: 0x100)

再结合调试器观察变量地址：

变量	地址	是否符合预期
`int g_flag = 1;`	0x20000000	✅
`const char* msg = "Hello";`	0x08000200	✅
`void SysTick_Handler()`	0x080001A0	✅

一切正常，说明scatter已成功接管内存布局 👏

性能飞跃的秘密武器：利用高速内存提升实时性

现在我们来玩点高级的。假设你的应用中有高频调用的数学运算函数，比如PID控制器中的积分微分计算，能不能让它跑得更快？

答案是肯定的——放进DTCM！

把关键函数搬进DTCM 🚀

首先在C代码中标记函数所属节区：

// pid_control.c
__attribute__((section("DTCM_FUNC")))
float fast_integral_update(float error, float dt) {
    static float integral = 0.0f;
    integral += error * dt;
    return integral;
}

然后在scatter文件中新增DTCM区域：

LR_DTCM 0x20000000 0x00010000 {      ; 定义DTCM加载域
    ER_DTCM_FUNC 0x20000000 {         ; 执行域
        *.o(DTCM_FUNC)                ; 匹配标记过的函数
    }
}

此时该函数会被链接到DTCM中执行。由于DTCM拥有独立总线且无等待周期，实测调用时间可减少30%~50%，尤其在没有Cache的老款MCU上效果显著。

⚠️ 注意事项：
- DTCM通常不支持DMA，不要在这里放DMA缓冲区；
- 确保MPU允许从该区域取指（XN位关闭）；
- 若函数依赖全局变量，需确认这些变量也在可访问范围内。

安全防线的第一道关卡：堆栈隔离防溢出

你还记得上次因为数组越界导致系统崩溃是什么时候吗？😅 很多时候罪魁祸首就是堆栈冲突。

默认情况下， .data 、 .bss 、heap、stack都在同一块SRAM里，随着malloc越来越多，heap向上增长，而函数调用层层深入，stack向下压，两者一旦相遇，后果不堪设想。

解决办法？ 物理隔离！

LR_IRAM1 0x20000000 0x00020000 {
    RW_GLOBALS 0x20000000 0x00008000 {   ; 前32KB给全局变量
        *.o(+RW +ZI)
    }

    HEAP_STACK 0x20008000 0x00008000 {   ; 后32KB专用于堆栈
        * (+HEAP)
        * (+STACK)
    }
}

还可以进一步精细化控制：

; 分离堆和栈到不同Bank
LR_HEAP_BANK 0x20000000 {
    ER_HEAP 0x20000000 {
        *(.heap)
    }
}

LR_STACK_BANK 0x20010000 {
    ARM_LIB_STACK 0x20010000 {
        *(ARM_LIB_STACK)
    }
}

并在启动代码中设置初始栈顶：

; startup.s
LDR    R0, =0x2001FFFF    ; 设置栈顶为第二Bank末尾
MSR    MSP, R0

这样一来，即使堆疯狂增长，也不会轻易碰到栈，大大增强了系统的鲁棒性。

OTA升级的灵魂：双区Bootloader设计

远程固件升级（OTA）已成为现代IoT设备的标配功能。但如果升级过程中断电，设备岂不是要变砖？当然不行！

“A/B分区”机制应运而生：两个互备的应用区轮流使用，哪怕一个坏了也能回滚。

如何用scatter实现？

假设Flash共1MB，划分为两个512KB的应用区：

App A：0x08000000 ~ 0x0807FFFF
App B：0x08080000 ~ 0x080FFFFF

分别编写两个scatter文件：

app_a.sct

LR_APP_A 0x08000000 {
    ER_RO_APP_A 0x08000000 {
        *.o(.text)
        *(.rodata)
    }
    ER_RW_APP_A 0x20000000 {
        *.o(.data)
        *(.bss)
    }
}

app_b.sct

LR_APP_B 0x08080000 {
    ER_RO_APP_B 0x08080000 {
        *.o(.text)
        *(.rodata)
    }
    ER_RW_APP_B 0x20000000 {
        *.o(.data)
        *(.bss)
    }
}

Bootloader通过标志位判断跳转目标：

void jump_to_app(uint32_t app_base) {
    uint32_t *vector_table = (uint32_t *)app_base;
    __set_MSP(vector_table[0]);        // 更新主堆栈指针
    SCB->VTOR = app_base;              // 重定位向量表
    ((void(*)())vector_table[1])();     // 跳转至Reset Handler
}

✅ 成功前提：每个应用的scatter文件都正确设置了向量表位置。

这种机制广泛应用于智能家居、车联网、医疗设备等领域，是构建高可用系统的重要一环。

安全加固：与MPU协同构建内存防火墙

你以为内存布局只是性能优化？错了，它更是安全防御的核心！

ARM Cortex-M内置的 内存保护单元（MPU） 可以为特定区域设置访问权限，比如：

Flash代码区：只读 + 可执行
SRAM数据区：读写 + 不可执行（防ROP攻击）
外部SDRAM：禁止执行 + 用户不可访问

但前提是—— MPU配置必须与实际内存布局完全一致！

scatter + MPU 协同示例

scatter定义：

LR_IROM1 0x08000000 {
    ER_SECURE_CODE 0x08000000 {
        secure_functions.o(+RO)
    }
}

LR_EXT_RAM 0xC0000000 {
    ER_LOG_BUFFER 0xC0000000 {
        log_data.o(+ZI)
    }
}

对应MPU初始化代码：

void configure_mpu(void) {
    MPU_Region_InitTypeDef region;

    // 区域0：安全代码区，只读可执行
    region.Enable = MPU_REGION_ENABLE;
    region.BaseAddress = 0x08000000;
    region.Size = MPU_REGION_SIZE_64KB;
    region.AccessPermission = MPU_REGION_PRIV_RO;
    region.DisableExec = MPU_INSTRUCTION_ACCESS_ENABLE;
    HAL_MPU_ConfigRegion(&region);

    // 区域1：外部SDRAM，禁止执行
    region.BaseAddress = 0xC0000000;
    region.Size = MPU_REGION_SIZE_8MB;
    region.AccessPermission = MPU_REGION_FULL_ACCESS;
    region.DisableExec = MPU_INSTRUCTION_ACCESS_DISABLE;  // ❗关键：禁止执行
    HAL_MPU_ConfigRegion(&region);

    HAL_MPU_Enable(MPU_PRIVILEGED_DEFAULT);
}

任何试图在SDRAM中运行代码的行为都会触发HardFault，从而阻止潜在的恶意注入攻击。

高级玩法：模块化固件与动态插件支持

虽然Cortex-M不支持Linux那样的动态库加载，但我们可以通过scatter预留空间，实现“伪动态链接”。

插件槽位预分配

g_plugin_slot1_start = 0x080A0000;
g_plugin_slot2_start = 0x080B0000;

LR_PLUGIN_POOL g_plugin_slot1_start {
    PLUGIN_SLOT_1 g_plugin_slot1_start {
        FILL(0xFF)                    ; 空闲填充
        *(.plugin1_code)
    }
    PLUGIN_SLOT_2 (+0) {
        FILL(0xFF)
        *(.plugin2_code)
    }
}

插件编译时固定基地址，运行时由Loader写入对应扇区。

主程序通过函数指针调用：

typedef struct {
    int (*init)(void);
    int (*process)(uint8_t*, int);
} plugin_api_t;

plugin_api_t* plugin = (plugin_api_t*)0x080A0000;
if (plugin->init() == 0) {
    plugin->process(buffer, len);
}

这种方式可用于现场更换图像滤镜、语音识别模型等场景，在保证可靠性的前提下提供一定灵活性。

错误排查指南：那些年我们一起踩过的坑 😵‍💫

写scatter文件最容易出现的问题有哪些？我帮你总结了几类高频故障及应对方法：

🔴 L6218E: Undefined symbol Image$$RW_IRAM1$$ZI$$Limit

原因：声明了执行域但没有实际内容填充，导致链接器未生成相关符号。

✅ 解决方案：
- 确保至少有一个段被分配到该区域；
- 或者显式添加兜底语句： *(+RW +ZI) 。

🟡 L3912W: Option ‘first’ specified, but no section matches selector

警告：你想把某个段放最前面，但它根本不存在。

✅ 检查项：
- 启动文件命名是否正确（如 startup_stm32f407xx.s ）；
- 段名拼写错误（ .text vs .TEXT ）；
- 目标文件未参与编译。

可通过命令行查看实际段名：

fromelf --symbols your_project.axf | grep RESET

🔴 地址重叠导致L6217E错误

典型症状：两个执行域用了相同的基地址。

✅ 查看.map文件中的“Region Cross Reference”表，快速定位冲突段。

建议做法：使用 +0 自动接续前一段，避免手动计算偏移。

最佳实践清单：专业团队都在用的规范 ✅

为了提升可维护性和协作效率，建议遵循以下规范：

注释清晰
每个scatter文件开头注明用途、作者、版本、变更记录。
统一命名习惯
- LR_xxx ：加载域
- ER_xxx ：执行域
- NO_INIT_xxx ：不初始化区域
使用宏定义常量 （可通过Python脚本生成）
scatter #define FLASH_APP_ADDR 0x08020000 #define DTCM_START 0x20000000
纳入Git版本管理
与硬件版本分支绑定，防止PCB改版导致映射错误。
建立模板库
- template_basic.sct ：通用单核项目
- template_bootloader.sct
- template_trustzone.sct
- template_dual_bank.sct