YUVMultiNet Real-time YUV multi-task CNN for autonomous driving

论文地址:https://arxiv.org/pdf/1904.05673.pdf

摘要

        在这篇文章中,我们提出了一个多任务卷积神经网络(CNN)框架优化对一个低功率汽车级Soc。我们介绍一个网络基于一个统一框架,其中编码是分享在两个任务检测和分割。这个提出的网络运行达到25帧在1280*1280像素上。我们主要讨论这个方法使用去优化网络框架,例如使用本地YUV图直接地,优化层&特征图以及应用量化。我们也集中在内存带宽在我们设计卷积,数据密集型和大部分SOCs带宽瓶颈。我们认证这个的有效,我们提出的网络对一个专用CNN加速展示这个关键绩效指标(KPI)在检测和分割任务上,从硬件执行和对应运行时间。

                                                    YUVMultiNet Real-time YUV multi-task CNN for autonomous driving

系统框架

                                                      YUVMultiNet Real-time YUV multi-task CNN for autonomous driving

YUV4:2:0图像空间

                                                      YUVMultiNet Real-time YUV multi-task CNN for autonomous driving

V2N9网络模型

                                                                     YUVMultiNet Real-time YUV multi-task CNN for autonomous driving

结论

      我们能合理地维持,三个主要贡献被展示在这篇文章中:一个数据数据层来专用和优化对YUV4:2:0图像空间,一个网络面向CNN核的低功率SoC和一个网络较高地减少框架靠近原始的多网络精度但速度比较快