如果说电源管理是芯片的“饭碗”,那么时钟系统就是芯片的“心脏”。
在低功耗设计中,我们面临一个永恒的矛盾:想跑得快(高频),心脏就得跳得快,耗能就大;想省电(低频),反应就慢,甚至可能错过外部信号。
如何设计一颗会“呼吸”的芯片,在 64MHz 的冲刺和 32kHz 的龟息之间优雅切换?这一篇,我们深入 STM32G0 和 RL78/G23 的时钟树(Clock Tree)深处,去挖掘那些数据手册里容易被忽略的细节。
一、 “起振时间”:被忽视的能量杀手
很多工程师计算功耗时,只计算“运行时间”和“休眠时间”,却忘记了**“起床气”——晶振起振时间 (Startup Time)**。
1. 外部晶振 (HSE/LSE) 的物理代价
石英晶体是机械谐振器件。当你给它通电,它不是瞬间稳定的,而是像荡秋千一样,幅度从小到大慢慢稳定下来。
-
残酷的现实:
-
一颗典型的 32.768kHz 晶振 (LSE),起振时间可能长达 1秒 ~ 2秒(取决于负载电容和驱动电流配置)。
-
一颗 8MHz 的高速晶振 (HSE),起振时间通常在 2ms (2000µs) 左右。
-
-
能量账单:
假设你的任务只需要 CPU 跑 100µs(比如读个传感器存到 Flash)。
-
如果你坚持用 HSE:你需要等待 2000µs (起振) + 100µs (干活)。95% 的电量都浪费在等晶振稳定上!
-
2. 破局之道:内部振荡器 (HSI/HOCO) 的逆袭
为了消灭起振时间,STM32G0 和 RL78/G23 都把重点放在了高精度的内部 RC 振荡器上。RC 振荡器几乎是瞬时启动的(几个微秒级)。
-
STM32G0 的策略:HSI16
-
G0 内部集成了 16MHz 的 HSI。出厂校准精度 $\pm 1\%$。
-
实战技巧: 在绝大多数低功耗应用中,彻底抛弃外部高速晶振 (HSE)。除非你需要 USB 或 CAN 的极高时钟精度,否则 HSI 足够应付 UART/SPI 通信。这直接省去了两颗电容、一颗晶振的 BOM 成本,以及宝贵的 2ms 等待电流。
-
-
RL78/G23 的策略:HOCO (High-speed On-Chip Oscillator)
-
RL78 的 HOCO 更激进,它可以最高输出 32MHz,且精度极高。
-
架构差异: RL78 的整个 UART/I2C 外设设计就预设你是用 HOCO 的,它甚至有专门的硬件修正电路来补偿温度带来的频偏,使得它在不用外部晶振的情况下也能稳定跑 115200 波特率。
-
二、 会呼吸的系统:动态频率切换 (Dynamic Frequency Scaling)
最好的低功耗策略不是一直慢,而是**“静若处子,动若脱兔”**。
1. STM32G0 的换挡操作
G0 的时钟树非常灵活,允许你在运行中切换 SYSCLK。
-
场景: 平时用 LSI (32kHz) 待机,监测传感器;一旦触发阈值,瞬间切到 HSI (16MHz) 甚至开启 PLL 飙到 64MHz 做 FFT 运算。
-
痛点: 切换是需要时间的。特别是开启 PLL,需要等待 Lock Time。
-
代码策略:
// 伪代码:STM32G0 的升频策略
// 1. 开启 HSI
// 2. 切换 SYSCLK 到 HSI (此时 16MHz)
// 3. 配置 PLL (如果你真的需要 64MHz) 并使能
// 4. 等待 PLL Ready
// 5. 切换 SYSCLK 到 PLL
-
注意: 如果你的运算任务能在 16MHz 下 5ms 内做完,就不要开 PLL。因为 PLL 本身就是个耗电大户,且等待 Lock 的时间可能比你做任务的时间还长。
2. RL78/G23 的中速之道
RL78 引入了一个有趣的概念:MOCO (Middle-speed On-Chip Oscillator),通常是 4MHz。
-
哲学: 很多时候,32kHz 太慢,32MHz 太快且费电。4MHz 是一个处理简单逻辑(如按键去抖、简单数据打包)的黄金频率。
-
无缝切换: RL78 在主系统时钟切换上设计得比 Cortex-M 更“傻瓜化”,通过写寄存器可以直接在 HOCO 和 MOCO 之间跳转,延迟极低。
三、 Flash 的拖累与“Run from RAM”
这是一个进阶技巧。
当 CPU 跑到 64MHz 时,Flash 是跟不上的。Flash 的读取速度有限,必须插入 Wait States (等待周期)。
-
STM32G0 的瓶颈: 在 64MHz 下,读取 Flash 可能需要 2 个等待周期。这意味着 CPU 实际上在空转等数据。
-
功耗陷阱: 每次从 Stop 模式唤醒,Flash 也就是从“断电/低功耗”状态醒来,这也需要时间(Flash Wakeup Latency)。
极致优化方案:Run from RAM (在 RAM 中运行程序)
既然 SRAM 醒来得快,且全速读写不需要等待周期,为什么不把关键代码搬到 RAM 里跑?
-
定义段: 在 Linker Script (.ld 文件) 中定义一个
.ram_code段。 -
指定函数: 使用
__attribute__((section(".ram_code")))将频繁调用的 ISR 或唤醒处理函数放到 RAM。 -
效果:
-
唤醒后瞬间执行,无需等待 Flash 预热。
-
无 Wait States,CPU 执行效率 100%,哪怕主频低一点也能更快干完活。
-
动态功耗降低: 访问 RAM 的功耗通常低于访问 Flash。
-
四、 谁在数羊?—— RTC 与 Interval Timer 的较量
在 CPU 睡觉(Stop/Standby)时,总得有个人醒着数时间,或者等到点把 CPU 叫醒。
1. STM32G0 的 RTC 及其 WUT (Wakeup Timer)
我们在上一节提到过,STM32 的 RTC 在低功耗下是王者,但也最难配置。
-
LSE 驱动能力的坑:
G0 的 LSE 驱动能力 (LSEDRV) 有 4 档可调。
-
最低档: 极度省电 (几百 nA),但抗干扰极差,手摸一下板子可能就停了,且起振极慢。
-
最高档: 起振快,稳,但耗电。
-
建议: 生产环境选低-中档,PCB 必须做包地处理 (Guard Ring)。
-
-
WUT (Auto-Wakeup Unit):
这是替代 SysTick 的关键。在 Stop 模式下,SysTick 停止计数。RTOS 想知道睡了多久,或者想实现 vTaskDelay(100),必须依赖 WUT。
-
WUT 是一个 16 位减法计数器,时钟源通常是 LSE/16 (2kHz)。它可以无需 CPU 干预,周期性地产生唤醒中断。
-
2. RL78/G23 的极简主义:12-bit Interval Timer
RL78 觉得 RTC 太复杂了。如果你不需要知道现在是“2026年1月5日”,只需要“每隔 100ms 醒一次”,为什么要开 RTC?
-
Interval Timer (IT):
-
直接挂在 fIL (15kHz 低速内部时钟) 上。
-
结构: 就是一个 12 位的计数器,极其简单。
-
功耗: 几乎可以忽略不计。
-
应用: 它是 RL78 实现伪 RTOS 调度的核心。比如每 1ms 产生一次中断作为 Tick,即便在 CPU 睡眠时也在走(唤醒 CPU)。
-
五、 总结与选型建议
| 特性 | STM32G0 (Arm Cortex-M0+) | Renesas RL78/G23 | 评价 |
| 高速时钟 | HSI (16MHz) + PLL (max 64MHz) | HOCO (max 32MHz/48MHz) | G0 爆发力强;RL78 启动更快。 |
| 低速时钟 | LSI (32kHz RC) / LSE (32.768kHz 晶振) | fIL (15kHz RC) / fSUB (32.768kHz) | G0 的 LSE 精度高但难伺候;RL78 的 fIL 极其省电。 |
| 时钟树复杂度 | 高 (Mux, Prescalers, PLL) | 低 (直接切换) | RL78 更容易上手配置。 |
| 唤醒等待 | Flash Wait States + Oscillator Startup | 几乎无等待 (SRAM/Flash 同步) | RL78 在频繁休眠-唤醒场景下效率更高。 |
/*******************************************
* Description:
* 本文为作者《嵌入式开发基础与工程实践》系列文之一。
* 关注我即可订阅后续内容更新,采用异步推送机制。
* 转发本文可视为广播分发,有助于信息传播至更多节点。
*******************************************/

被折叠的 条评论
为什么被折叠?



