CVPR2018论文笔记(二)PPFNet_Part2

这周主要学习了两部分内容,分别是论文中图2的内容和本文对PointNet的介绍。

一、Figure 2.PPFNET

[注]图片源于论文
CVPR2018论文笔记(二)PPFNet_Part2
Figure 2.PPFNET, our inference network, consists of multiple PointNets, each responsible for a local patch. To capture the global context across all local patches, we use a max-pooling aggregation and fusing the output back into the local description. This way we are able to produce stronger and more discriminative local representations.
图2。PPFNET,我们的推理网络,包括多个PointNet,每个PointNet负责一个局部补丁(斑块)。为了在所有局部补丁中捕获全局背景,我们使用一个最大池化操作聚合并将输出融合回局部描述中。通过这种方式,我们能够产生更强和更具判别性的局部表示。
这张图重点介绍了什么是PPFNet,利用一张现场采集的室内点云图片,其由多个patch description-Fr组成。整个网络包含多个PointNet,为了通过local patch来捕获全局背景,作者采用最大池化操作,并将其输出融合到各个局部描述中去,最终获得更强、更具判别性的局部表示。
注:加粗部分均为专有名词。
【max-pooling】
CVPR2018论文笔记(二)PPFNet_Part2
https://www.cnblogs.com/yuanshuo98/articles/8898952.html图片来源。
【MLP】MLP(Multi-Layer Perceptron),即多层感知器,是一种前向结构的人工神经网络,映射一组输入向量到一组输出向量。(概念来自baidu百科词条)

二、PointNet简介:

PointNet [30] is an inspiring pioneer addressing the issue of consuming point clouds within a network architecture. It is composed of stacking independent MLPs anchored on points up until the last layers where a high dimensional descriptor is synthesized. This descriptor is weak and used in max-pooling in order to aggregate to a global information, which is then fed into task specific losses. Use of the max-pooling function makes the network inconsiderate of the input ordering and that way extends notions of deep learning to point sets. It showed potential on tasks like 3D model classification and segmentation. Yet, local features of PointNet are only suitable for the tasks it targets and are not generic. Moreover, the spatial transformer layer employed can bring only marginal improvement over the basic architectures. It is one aspect of PPFNet to successfully cure these drawbacks for the task of 3D matching. Note, in our work, we use the vanilla version of PointNet.
PointNet[30]是一个鼓舞人心的开拓者解决了获取包含网络结构的点云信息的问题。它由层叠独立的MLP组成,锚定在点的上方,直到合成高维描述符的最后一层。这个描述符很脆弱,被用于max-pooling中,以便聚合一个全局信息,这个描述符接着被馈送到任务的特定损失中。使用max-pooling函数使得网络不考虑输入顺序,并且这种方式将深度学习的概念扩展到点集中。它显示了在三维模型分类和分割等任务中的潜力。然而,PointNet的局部特征仅适用于它所指定的任务而不是通用的。此外,所采用的空间变压器层只能带来基本架构上的边缘改善。PPFNET的一个方面是成功地解决了3D匹配任务的这些缺点。注意,在我们的工作中,我们使用了普通版本的PointNet。
简要介绍了什么是PointNet,这部分内容尚未完全理解。后续还需更深入了解相关知识。