C3D 网络
Let's Open this paper (使用3D卷积网络学习时空特征)
"花了一晚上加一上午看了C3D网络的paper,说实话这个网络现在对于行为识别已经有点过时了,只是里面的3D卷积成为了经典,没有花里胡哨的连接,只有传统网络的一条路,卷积,池化,分类。我用这个网络的主要目的是用来3D医学图像分类的。"
常用数据库
行为识别的数据库比较多,这里主要介绍两个最常用的数据库,也是近年这个方向的论文必做的数据库。
UCF101: YouTube视频,共计101类动作,13320段视频。
共有5个大类的动作:
1 人-物交互 2 肢体运动 3 人-人交互 4 弹奏乐器 5 运动 数据库Link
HMDB51: YouTube视频,共计51类动作,约7000段视频。 数据库Link