TI TDA2x实现道路语义分割Semantic Segmenation

语义分割

语义分割是当今计算机视觉领域的关键问题之一。从宏观上看,语义分割是一项高层次的任务,为实现场景的完整理解铺平了道路。场景理解作为一个核心的计算机视觉问题,其重要性在于越来越多的应用程序通过从图像中推断知识来提供营养。
其中一些应用包括自动驾驶汽车、人机交互、虚拟现实等,近年来随着深度学习的普及,许多语义分割问题正在采用深层次的结构来解决,最常见的是卷积神经网络,在精度上大大超过了其他方法。以及效率。

标题TDA2x Semantic Segmenation

TITDA2x作为一款车规级芯片同样提供了基于道路场景的语义分割用用例,用例的流程图如下所示:
TI TDA2x实现道路语义分割Semantic Segmenation
调用了一个ARM和4路EVE完成整个功能,ARM上主要负责视频流编解码以及显示,而EVEs上负责深度学习语义分割的处理。

先附上效果图
TI TDA2x实现道路语义分割Semantic SegmenationTI TDA2x实现道路语义分割Semantic Segmenation
整体分割效果不错,能准确分割车、人、地面、交通标识,且误检率较低。但是存在视频流卡顿的问题,在打印log信息以及咨询TI工程师之后确认,是由于芯片算例处理能力有限造成的,TI每一个EVE单独处理一帧图像的时间大概在320ms,FPS=1000/320=3,那么4路EVE每秒能处理的帧数FPS=3*4=12帧,实时性会受影响。

输入数据问题

由于此用例不是从Capture获取数据,而是将3通道RGB视频流压缩成两个二进制文件:h264视频文件和index信息文件Header.hdr作为输入,涉及Null source 解码和显示的问题,需要使用ffmpeg制作数据源。在这里不展开讲解,有兴趣可以参考以下文章:
https://e2e.ti.com/support/processors/f/791/p/639881/2391227#pi239031350filter=all&pi239031350scroll=false&pi239031350=2
https://e2e.ti.com/support/processors/f/791/t/918243