ncnn常见问题和可优化点备忘

本文探讨了NCNN框架中提取器频繁创建释放导致的性能瓶颈,并提出了使用自定义内存管理来优化的方法。同时介绍了Android平台中常见的YUV420SP色彩空间及其转换到RGB的过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 
问题1:
 目前的实现是每次extract都会重新分配内存,然后下一次预测再重新create extractor,重新分配所有blob的内存吧?
这样对于一些持续检测的应用来说,不断的分配回收内存,是不是也存在较大的开销呀
有没有选项,可以让ncnn每次预测完后不销毁blob,而是每次都复用,这样可以减少频繁重复调用时malloc和free的开销?

从目前的框架上来看,每次都需要创建一个extractor对象,而blob的数据是extractor的私有数据,所以只能频繁重复调用create/release,对于你那种很轻的网络,这里就是性能瓶颈之一了 。
自己写个 fastMalloc 和 fastFree 换掉 mat.h,自己实现内存池,或者 tcmalloc 。


问题2:
yuv420sp转rgb
因为 android 上面摄像头回调是yuv420sp,yuv420sp转rgb,是y平铺,vu 交叉。
420p是全平铺。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值