ARM64架构手动编译libtorch，安装MKL/oneDNN加速模型推理，详细流程！

大菠菠菠萝

已于 2025-01-07 11:52:45 修改

阅读量941

点赞数 8

文章标签：服务器运维

于 2025-01-07 11:47:47 首次发布

本文链接：https://blog.youkuaiyun.com/qq_44362147/article/details/144978908

版权

前言：

libtorch官方并没有给出ARM64架构的安装文件，在ARM64环境下，libtorch需要手动编译。编译完成后发现模型推理速度太慢，部分原因为手动编译的libtorch没有使用MKL加速工具，安装MKL后重新编译libtorch后，模型的推理速度提高了4-5倍。

一、依赖环境

cmake和gcc版本不能过低，不然编译过程会报错。 gcc版本至少大于10.0。python环境所需安装：

pip install pyyaml

二、下载pytorch源码

git clone https://github.com/pytorch/pytorch --recursive && cd pytorch
# 下载子模块
git submodule sync
git submodule update --init --recursive

三、下载oneDNN源码

cd到你的工作目录，然后进行下载oneDNN源码文件。以我的工作目录为例：

cd /home/user/workspace
wget https://github.com/oneapi-src/oneDNN/archive/refs/tags/v3.3.3.tar.gz --no-check-ce

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

大菠菠菠萝

关注关注

8
点赞
踩
6

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

鲲鹏arm服务器部署paddleOCR

loveisastory的博客

06-27

1885

鲲鹏920arm64 cpu没有avx指令集，ocr无法启用cpu加速，现在平均识别一页A4纸约30秒。是否启用多进程，对识别性能影响几乎可以忽略不计目前可以在鲲鹏920arm cpu上正常执行识别的一个组合环境为：操作系统：uos server V20 1050epython3.8.2（需要内置sqlite模块）识别pdf，在python3.8以上需要手工处理fitz与PyMuPDF的关系，需要安装某个特定版本才可以。

MKLDNN推理加速技术简介

LF_AI的博客

10-19

1546

深度学习在进行推理时，很多应用场景在对硬件有一定限制的情况下，对推理速度还有比较高的要求，如移动端的人脸识别与语音语义识别、安防领域的烟雾报警等。在这些领域中，推理速度的快慢不但直接影响着...

3 条评论您还未登录，请先登录后发表或查看评论

arm64平台编译libtorch

chen499093551的博客

03-13

3504

到项目编译的时候发现报错，显示应该基于lapack库编译，回看了libtorch的编译日志发现系统之前装的blas库有问题导致lapack找不到底层实现，所以编译libtorch的时候依赖lapack的部分都跳过了，重装了blas之后发现没解决问题，还是找不到blas，就换了openblas库，编译成功。编译完成后build/lib文件夹下就是编译好的库了，一起复制到项目里；复制pytorch/torch/share/cmake文件夹到libtorch/share，这是cmake的文件。

pytorch v2.7.0震撼发布！Blackwell GPU支持+编译性能狂飙，AI开发者必看10大升级

福大大架构师每日一题

04-28

1184

PyTorch 2.7.0将效率与灵活性推向新高度，无论是大模型训练还是边缘设备部署，这次更新都值得立即尝鲜！

win10 下源码编译Libtorch

juluwangriyue的博客

09-05

2098

很多时候使用官方的库没什么大问题，也很方便，但有时候也需要使用源码编写库。这里碰到一个问题需要编写pytorch的libtorch库，记录一下大致步骤与问题；下载源码：从官方克隆最新的代码的时候要加入recursive这个参数，因为Pytorch本身需要很多的第三方库参与编译：git clone --recursive https://github.com/pytorch/pytorch 启动Anaconda虚拟环境（建议搭建一个纯净的虚拟环境），不知道如何搭建虚拟环境的，可以..

ARM64平台编译libtorch

m0_66486211的博客

12-04

1156

Traceback (most recent call last): File "../tools/build_libtorch.py", line 14, in from tools.build_pytorch_libs import build_caffe2 File "/home/wheeltec/Documents/YOLO_ORB_SLAM3-master/Thirdparty/pytorch/tools/build_pytorch_libs.py", line

Libtorch编译

qq_39125442的博客

08-06

4064

关于libtorch的问题 libtorch的编译主要由下面两篇博文解决： https://www.cnblogs.com/cheungxiongwei/p/10689483.html https://www.cnblogs.com/chuijingjing/p/9159209.html，如果出现找不到编译器的情况就通过这个方法解决 libtorch编译完成后，写了一个cpp测试torch...

Windows环境下使用 LibTorch（1.4）

Challovactor的博客

03-11

4454

最近使用LibTorch在调用分类模型，在配置环境时，用到了1.4版本的PyTorch，按照网上的一些教程无法成功，便把自己部署成功的经验分享出来。 1. 从官网下载已经编译好的LibTorch库官网地址：（https://pytorch.org/）根据自己的环境可以下载GPU版和CPU版。 2. 使用cmake命令创建项目，失败！安装使用可参考官网文档：htt...

libtorch编译和使用

flying_ant2018的博客

03-28

545

3.0 编译安装libtorch。1.0 安装cmake 3.15。2.0 安装opencv。

libtorch arm

最新发布

05-16

### 关于LibTorch在ARM架构上的使用、安装和支持 #### LibTorch简介 LibTorch 是 PyTorch 的 C++ 前端库，允许开发者通过 C++ 接口构建和部署机器学习模型。尽管其主要设计目标是在 x86 架构上运行，但在 ARM 架构...

wenet在arm开发板rk3588编译踩坑记录

wienerjier的博客

09-09

2182

wenet用的是libtorch1.10.0，这里需要下载pytorch1.10.0进行编译。在加载模型 torch::jit:load(model_path,device) 前，增加如下代码，注意这里下载最新的模型，老版本比如wenet-1.0.1版本下的模型会出现类似下面的无法识别的错误。编译pytorch1.12.0报如下错误的解决办法：将每个error出现的代码中的。原wenet中是下载libtorch，这里改成第一步自己编译好的pytorch。内存不够或MAX_JOBS设置太大时会出现如下错误。

libtorch-rpi-aarch64-cxx11-abi-shared-without-deps-1.6.0.zip

09-11

提供libtorch(arm64)预编译包(无依赖)，

Libtorch的在pytorch的stable1.0版本编译的CPU版本

01-07

Libtorch的在pytorch的stable1.0版本编译的CPU版本，这个可以通过window下的cmd指令直接编译或者使用cmake-gui进行编译，注意其不支持VS2013及一下版本。最好使用VS2017.

libtorch.zip

08-24

windows平台编译的32位的libtorch，基于vs2017版本编译。此版本不支持gpu。windows平台下cpu版的libtorch性能没有保障。有需求的可以尝试ncnn，mnn等平台。

libtorch_learn：libtorch笔记

02-27

Mac上的libtorch，请注意

ARM NN:Ubuntu 14.04 Caffe和TensorFlow以及TF-lite的ARM NN SDK编译环境搭建及MNIST程序测试

coinv2014的博客

11-01

4870

Ubuntu 14.04下aarch64配置Caffe和TensorFlow的ARM NN SDK的编译环境搭建及MNIST程序测试ARM官方测试环境1. SCons安装2.安装CMake3.下载安装boost4.使用 SCons编译Compute Library using5.编译protobuf6编译Caffe7下载TensorFlow8 编译ARMNN-SDK9 MNIST（手写体图片识别测...

libtorch编译C++版本

hanqu3456的博客

12-05

5714

libtorch编译C++版本一. 下载pytorch源码 git clone https://github.com/pytorch/pytorch.git cd pytorch git submodule sync git submodule update --init --recursive 二. 编译 1.安装依赖 # first: 安装cuda与cudnn，下载cuda10.0对应.run文件与对应的cudnn7.6.5 sh cuda_10.0.130_410.48_linux.run --n

Pytorch源码编译Libtorch

南城以北的博客

09-21

1400

新建 libtorch 目录，将 pytorch/torch/include 目录复制到 libtorch 目录下，将 build/lib 目录复制到 libtorch 目录下。文件，该文件中记录了子模块的存储路径和下载地址。打开文件后修改子模块的。如果不能通过 HTTPS 方式更新子模块，可以通过。下载 Pytorch，可通过。都修改好后，依次执行。

【libtorch】pytorch源码编译生成c++ 17 libtorch记录

shuaixio的博客

06-01

4913

pytorch源码，编译选项c++17，libtorch，源码编译