深度学习计算框架综述(十三)HVX 计算优化实践—VCAP Hexagon 计算框架介绍

本文介绍了VCAP Hexagon DSP计算框架,它是一个针对高通DSP的高性能计算框架,简化为模型层、框架层和计算层。模型层通过vaim2bin工具实现模型转换和内存复用策略。框架层解析模型并执行内存复用,计算层使用HVX汇编优化OP计算。文章还讨论了DSP VTCM的利用和不同架构的计算策略,并对比了VCAP DSP与其他平台的性能,展示其在深度学习推理中的优势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

架构简介:

VCAP Hexagon DSP计算框架是一个针对高通DSP的高性能计算框架,框架可以简化为三层结构:

 模型层:负责模型转换,提供了vaim2bin转换工具,通过vaim2bin将vaim模型转换成DSP param/bin模型,并计算内存复用的策略

 框架层:负责模型解析、dspCV的初始化、内存复用策略的执行、OP的计算策略

 计算层:负责计算策略的执行,使用HVX汇编对常见的OP进行了深度优化

 

针对这三层,此处再展开描述一下:

 

模型层也可以采用其他的模型格式,比如flatbuffer,protobuf,我们采用param/bin的模型格式的主要原因是,无需引入三方依赖,可有效减少SDK的体积,vaim2bin工具,在 内存复用算法设计 这篇文章中有介绍过,这篇文章主要讲的是Feature Map层级的内存复用算法,但其实也可以将这种内存复用的思想推广到模型层级甚至进程层级,这对于我们构建一个AI系统是必不可少的,我们也在推进这方面的工作。

 

框架层主要

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值