数据集构成

分为训练集与测试集，分别包含7481和7518张图片，每张图片有对应的点云数据。
其中，只有训练集的ground truth被公布。
Ground truth的格式为：
KITTI 3D Object Detection Dataset

对应的涵义为：
KITTI 3D Object Detection Dataset

特点：

Evaluation

与2D的检测问题一样， AP（Average Precision）是用于衡量算法性能的主要指标。计算IoU时使用的维度不同，得到的AP也不同。常用的AP计算方式有三种：

但AP只考虑到检测结果的（分类和）位置上的表现，不能衡量检测结果的方向是否正确。所以还有另一个衡量指标 AOS, Average Orientation Similarity, 平均方向相似性，用于衡量检测结果与Ground truth的方向相似程度。

AP的计算方式为：

A P = \frac{1}{11} \sum_{r \in {0, 0.1, \dots, 1.0}} max_{\hat{r} : \hat{r} \geq r} P (\hat{r})

AOS的计算方式与AP类似：

A O S = \frac{1}{11} \sum_{r \in {0, 0.1, \dots, 1.0}} max_{\hat{r} : \hat{r} \geq r} S (\hat{r})

其中 $P (r)$ 分别代表 $r e c a l l = r$ 时的 precision.

P (r) = \frac{T P}{T P + F P}

具体计算方式可参考Pascal voc的evaluation.

$S (r)$ 分别代表 $r e c a l l = r$ 时的orientation similarity.

S (r) = \frac{1}{| D_{r} |} \sum_{i \in D_{r}} \frac{1 + c o s Δ θ}{2} δ_{i}

其中:

可以看出，当两个框的角度相同时， $Δ θ = 0$ , 方向相似度为1; $Δ θ = π$ 时，方向相似度为1.

有的论文里(AVOD)也将3D上计算的AOS称为AHS（Average Heading Similarity）.