问题背景
在使用 colcon build 进行 ROS 2 包编译时,默认会使用所有 CPU 核心进行并行编译。然而,在内存较小的设备(如地平线 X5 开发板)上,大量并行编译可能会导致内存不足,进而卡死或崩溃。
本篇文章介绍如何通过调整并行编译线程数以及增加 Swap 交换空间,解决 colcon build 编译过程中的卡死问题。
解决方案
- 限制 colcon build 并行编译线程数
colcon build
默认使用的线程数等于 CPU 核心数,可以通过以下方式查看 CPU 内核数:
nproc
如果设备内存有限,可以限制并行编译的线程数,减少内存消耗:
colcon build --parallel-workers 4 # 仅使用 4 个线程进行编译
或者完全关闭并行编译,采用顺序执行方式:
colcon build --executor sequential
- 增加 Swap 交换空间
如果设备内存较小,建议增加 Swap 交换空间,以避免因内存不足导致的编译失败。
2.1 检查是否存在启用的 Swap
swapon --show
cat /proc/swaps
如果没有 Swap 交换空间,可以按照以下步骤创建新的 Swap。
2.2 关闭并删除已有 Swap
如果设备已经存在 Swap,但大小不足,可以先关闭并删除:
sudo swapoff /swapfile # 关闭 Swap
sudo rm /swapfile # 删除 Swap 文件
2.3 创建新的 Swap 文件(8GB)
sudo fallocate -l 8G /swapfile # 创建 8GB Swap 文件
sudo chmod 600 /swapfile # 仅 root 具有读写权限
sudo mkswap /swapfile # 设置为 Swap 格式
sudo swapon /swapfile # 启用 Swap
2.4 配置开机自动启用 Swap
编辑 /etc/fstab 文件,使 Swap 在系统启动时自动挂载:
echo "/swapfile none swap sw 0 0" | sudo tee -a /etc/fstab
sudo mount -a
2.5 验证 Swap 是否生效
swapon --show
free -h
- 监控内存使用情况
在地平线 X5 开发板上进行编译时,不建议远程连接,因为编译过程中可能因内存不足而断开。建议使用以下命令实时监控内存变化:
watch -n 0.5 free -h
此命令每 0.5 秒刷新一次内存状态,确保系统在可接受的内存范围内运行。
总结
在 colcon build 编译过程中,如果遇到卡死问题,可以采取以下措施:
限制 colcon build 的并行编译线程数,减少内存占用。
增加 Swap 交换空间,确保编译过程中不会因内存不足导致崩溃。
在地平线 X5 开发板上进行编译时,避免远程连接,并使用 watch -n 0.5 free -h 监控内存使用情况。
通过这些优化措施,可以有效提高 colcon build 的编译成功率,避免编译卡死的问题。