ARM Compute Library 项目推荐
项目基础介绍和主要编程语言
ARM Compute Library 是一个为 Arm CPU 和 GPU 优化的计算机视觉和机器学习函数库。该项目主要使用 C++ 语言编写,旨在提供高性能的计算能力,适用于嵌入式系统和移动设备。
项目核心功能
ARM Compute Library 提供了以下核心功能:
- 机器学习函数:包括多种卷积算法(如 GeMM、Winograd、FFT、直接和间接-GeMM),支持多种数据类型(如 FP32、FP16、INT8、UINT8、BFLOAT16)。
- 计算机视觉函数:优化了多种计算机视觉任务的性能。
- 微架构优化:针对关键的机器学习原语进行了微架构优化,提供了高度可配置的构建选项,以生成轻量级的二进制文件。
- 高级优化技术:如内核融合、快速数学启用和纹理利用。
- 设备和负载特定调优:使用 OpenCL 调优器和 GeMM 优化启发式方法。
项目最近更新的功能
ARM Compute Library 最近的更新包括:
- NCHW 数据格式优化移除:逐步从代码库中移除 NCHW 数据格式特定的优化,用户需要将 NCHW 模型转换为 NHWC 以受益于优化。
- 实验性 Bazel 和 CMake 构建:引入了实验性的 Bazel 和 CMake 构建,仅支持 CPU 构建。
- 安全性和代码质量改进:在预构建二进制文件中引入了与安全性相关的编码实践标志,如
-Wall、-Wextra等。 - 开发者证书:引入了开发者证书(DCO)流程,要求贡献者在每次提交时签名。
通过这些更新,ARM Compute Library 进一步提升了其在嵌入式和移动设备上的性能和安全性,同时简化了开发者的贡献流程。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



