ARM Compute Library 项目推荐

ARM Compute Library 项目推荐

项目基础介绍和主要编程语言

ARM Compute Library 是一个为 Arm CPU 和 GPU 优化的计算机视觉和机器学习函数库。该项目主要使用 C++ 语言编写,旨在提供高性能的计算能力,适用于嵌入式系统和移动设备。

项目核心功能

ARM Compute Library 提供了以下核心功能:

  1. 机器学习函数:包括多种卷积算法(如 GeMM、Winograd、FFT、直接和间接-GeMM),支持多种数据类型(如 FP32、FP16、INT8、UINT8、BFLOAT16)。
  2. 计算机视觉函数:优化了多种计算机视觉任务的性能。
  3. 微架构优化:针对关键的机器学习原语进行了微架构优化,提供了高度可配置的构建选项,以生成轻量级的二进制文件。
  4. 高级优化技术:如内核融合、快速数学启用和纹理利用。
  5. 设备和负载特定调优:使用 OpenCL 调优器和 GeMM 优化启发式方法。

项目最近更新的功能

ARM Compute Library 最近的更新包括:

  1. NCHW 数据格式优化移除:逐步从代码库中移除 NCHW 数据格式特定的优化,用户需要将 NCHW 模型转换为 NHWC 以受益于优化。
  2. 实验性 Bazel 和 CMake 构建:引入了实验性的 Bazel 和 CMake 构建,仅支持 CPU 构建。
  3. 安全性和代码质量改进:在预构建二进制文件中引入了与安全性相关的编码实践标志,如 -Wall-Wextra 等。
  4. 开发者证书:引入了开发者证书(DCO)流程,要求贡献者在每次提交时签名。

通过这些更新,ARM Compute Library 进一步提升了其在嵌入式和移动设备上的性能和安全性,同时简化了开发者的贡献流程。

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值