YUVMultiNet Real-time YUV multi-task CNN for autonomous driving

本文提出了一种针对低功耗汽车级SoC优化的多任务卷积神经网络框架,该框架在检测和分割任务上表现优异,运行效率高,能够达到25帧每秒在1280*1280像素上。通过直接使用YUV4:2:0图像空间,优化网络层与特征图,以及应用量化等策略,显著提升了网络性能并降低了功耗。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文地址:https://arxiv.org/pdf/1904.05673.pdf

摘要

        在这篇文章中,我们提出了一个多任务卷积神经网络(CNN)框架优化对一个低功率汽车级Soc。我们介绍一个网络基于一个统一框架,其中编码是分享在两个任务检测和分割。这个提出的网络运行达到25帧在1280*1280像素上。我们主要讨论这个方法使用去优化网络框架,例如使用本地YUV图直接地,优化层&特征图以及应用量化。我们也集中在内存带宽在我们设计卷积,数据密集型和大部分SOCs带宽瓶颈。我们认证这个的有效,我们提出的网络对一个专用CNN加速展示这个关键绩效指标(KPI)在检测和分割任务上,从硬件执行和对应运行时间。

                                                    

系统框架

                                                      

YUV4:2:0图像空间

                                                      

V2N9网络模型

                                                                     

结论

      我们能合理地维持,三个主要贡献被展示在这篇文章中:一个数据数据层来专用和优化对YUV4:2:0图像空间,一个网络面向CNN核的低功率SoC和一个网络较高地减少框架靠近原始的多网络精度但速度比较快

了解更多关于《计算机视觉与图形学》相关知识,请关注公众号:

下载我们视频中代码和相关讲义,请在公众号回复:计算机视觉课程资料

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值