目录
前言:
libtorch官方并没有给出ARM64架构的安装文件,在ARM64环境下,libtorch需要手动编译。编译完成后发现模型推理速度太慢,部分原因为手动编译的libtorch没有使用MKL加速工具,安装MKL后重新编译libtorch后,模型的推理速度提高了4-5倍。
一、依赖环境
cmake和gcc版本不能过低,不然编译过程会报错。 gcc版本至少大于10.0。python环境所需安装:
pip install pyyaml
二、下载pytorch源码
git clone https://github.com/pytorch/pytorch --recursive && cd pytorch
# 下载子模块
git submodule sync
git submodule update --init --recursive
三、下载oneDNN源码
cd到你的工作目录,然后进行下载oneDNN源码文件。以我的工作目录为例:
cd /home/user/workspace
wget https://github.com/oneapi-src/oneDNN/archive/refs/tags/v3.3.3.tar.gz --no-check-ce