【论文速读】基于图像的伪激光雷达三维目标检测
标题:End-to-End Pseudo-LiDAR for Image-Based 3D Object Detection
作者:Rui Qian, Divyansh Garg Yan Wang
来源:CVPR 2020
星球ID:particle
本文仅做学术分享,如有侵权,请联系删除。欢迎各位加入免费知识星球,获取PDF论文,欢迎转发朋友圈分享快乐。
论文阅读模块将分享点云处理,SLAM,三维视觉,高精地图相关的文章。公众号致力于理解三维视觉领域相关内容的干货分享,欢迎各位加入我,我们一起每天一篇文章阅读,开启分享之旅,有兴趣的可联系微信dianyunpcl@163.com。
●论文摘要

可靠、准确的三维物体检测是安全自主驾驶的必要条件。尽管激光雷达传感器可以提供周围环境的三维点云数据,但在许多情况下,它们的成本也高得让人望而却步。最近,伪激光雷达(PL)的引入使得基于LiDAR传感器的方法与基于廉价立体相机的方法之间的精度差距大大缩小。PL通过将二维深度图输出转换为三维点云输入,将用于三维深度估计的最新深度神经网络与用于三维目标检测的深度神经网络相结合。然而,到目前为止,这两个网络必须分开训练。在本文中,我们介绍了一个新的框架,它基于differentiable Change of Representation(CoR)模块,允许对整个PL流程进行端到端的训练。该框架与大多数最先进的网络兼容,适用于这两项任务,并与PointRCNN相结合,在所有测试数据集中中始终优于其他方法的PL方法,在基于KITTI图像的3D目标检测排行榜上获得了最高的排名。代码开源在 https://github.com/mileyan/pseudo-LiDAR_e2e
●内容介绍

虽然伪激光雷达模块在概念上是很吸引人的研究,但是需要两个独立的训练系统组合会产生一定的性能损失,特别是,伪激光雷达需要两个系统:一个是深度估计器,能够训练出一个通用的深度估计的图像,另一个是目标检测器将训练得到的深度估计转换到点云数据上,这两个训练目标不太可能与最终的目标最佳匹配,以最大的限度的提高检测精度,文章选择可具有代表性的目标检测POXOR和PointRCNN来验证提出的端到端的伪激光雷达(E2E-PL)方法,在所有评估设置中,我们都优于基线伪激光雷达管道和改进的PL++算法,并且显著优于其他基于图像的三维物体探测器。在提交时,我们的E2E-PL和PointRCNN在基于KITTI图像的3D物体检测排行榜上保持着最好的结果。我们的定性结果进一步证实了端到端的训练可以有效地计算深度估计器在目标边界附近改进其估计,这对于精确地定位目标至关重要

端到端学习器流程说明。绿色包围盒是汽车的地面真相检测。黄色的点是来自激光雷达的点。粉红色点云是由一个独立训练的深度估计器生成的,它是不准确的,并且不在绿盒内。通过端到端的深度估计和三维目标检测,得到了较好的蓝色点云。在此基础上,目标探测器可以产生最先进的性能。
1
端到端的伪激光雷达
伪激光雷达流程上分两种目标不同的训练步骤。首先,深度学习估计器来估计立体图像中所有像素的一般深度;然后训练基于激光雷达的探测器。

端到端的伪激光雷达:端到端基于图像的三维目标检测:我们引入了一个表示层的改变,将深度估计网络的输出作为三维目标检测网络的输入。其结果是一个端到端的管道,直接从立体图像生成对象边界框,并允许在所有层进行反向传播。黑色实心箭头表示向前通过;蓝色和红色虚线箭头分别表示目标检测损失和深度损失的反向过程。*表示我们的CoR层能够反推不同表示之间的梯度。

量化:我们使用软量化或硬量化对输入的伪激光雷达(PL)点云进行体素化。绿色体素是那些受PL点影响的体素。具有检测损失L_det正梯度的蓝色体素施加力将点从其中心推到其他体素,而具有负梯度的红色体素施加力将其他体素的点拉到其中心。只有当PL点影响这些体素时,红、蓝体轴上的这些力才能影响PL点。软量化增加PL点的影响区域,从而增加力,允许其他体素的点被推开或拉向。因此,更新后的PL点可以变得更接近地面真实激光雷达点云。



深度估计的定性结果。PL++(仅限图像)的顶部有许多估计错误的像素。通过端到端的训练,提高了对车辆周围深度的估计,得到的伪激光雷达点云具有更好的质量。

鸟瞰图的结果。红色边界框表示地面真实,绿色边界框表示检测结果。PL++(仅限图像)错过了许多远处的汽车,并且边界框定位较差。通过使用端到端的训练,我们可以得到更精确的预测(第一列和第二列),并减少假阳性预测(第三列)
●总结
本文介绍了一种伪激光雷达的端到端训练框架[1,2]。我们提出的框架可以适用于三维目标探测器,它可以是直接点云输入,也可以是量化结构输入。由此产生的模型在基于图像的三维物体检测方面开创了新的技术水平,并进一步缩小了立体和基于激光雷达的传感器之间剩余的精度差距。
参考文献
【1】Yan Wang, Wei-Lun Chao, Divyansh Garg, Bharath Hariharan, Mark Campbell, and Kilian Q. Weinberger. Pseudo-lidar from visual depth estimation: Bridging the gap in 3d object detection for autonomous driving. In CVPR, 2019.
【2】Yurong You, Yan Wang, Wei-Lun Chao, Divyansh Garg, Geoff Pleiss, Bharath Hariharan, Mark Campbell, and Kilian Q Weinberger. Pseudo-lidar++: Accurate depth for 3d object detection in autonomous driving. In ICLR, 2020.
资源
三维点云论文及相关应用分享
【点云论文速读】基于激光雷达的里程计及3D点云地图中的定位方法
3D-MiniNet: 从点云中学习2D表示以实现快速有效的3D LIDAR语义分割(2020)
PCL中outofcore模块---基于核外八叉树的大规模点云的显示
更多文章可查看:点云学习历史文章大汇总
SLAM及AR相关分享