基于激光雷达增强的三维重建

2024-07-31 22:56:03

标题：LiDAR-enhanced Structure-from-Motion

作者：Weikun Zhen Yaoyu Hu Huai Yu Sebastian Scherer

来源：点云PCL

欢迎各位加入免费知识星球，获取PDF论文，欢迎转发朋友圈分享快乐。

论文阅读模块将分享点云处理，SLAM，三维视觉，高精地图相关的文章。公众号致力于理解三维视觉领域相关内容的干货分享，欢迎各位加入我，我们一起每天一篇文章阅读，开启分享之旅,有兴趣的可联系微信dianyunpcl@163.com。

摘要

尽管运动恢复结构（SfM）作为一种成熟的技术已经在许多应用中得到了广泛的应用，但现有的SfM算法在某些情况下仍然不够鲁棒。例如，比如图像通常在近距离拍摄以获得详细的纹理才能更好的重建场景细节，这将导致图像之间的重叠较少，从而降低估计运动的精度。在本文中，我们提出了一种激光雷达增强的SfM流程，这种联合处理来自激光雷达和立体相机的数据，以估计传感器的运动。结果表明，在大尺度环境下，加入激光雷达有助于有效地剔除虚假匹配图像，并显著提高模型的一致性。在不同的环境下进行了实验，测试了该算法的性能，并与最新的SfM算法进行了比较。

CMU Smith Hall重建点云模型（灰色），覆盖视觉特征点（红色）

相关工作与主要贡献

基于机器人的检测需求越来越大，需要对桥梁、建筑物等大型土木工程设施的高分辨率图像数据进行处理。这些应用通常使用高分辨率、宽视场（FOV）相机，相机在离结构表面近距离处拍摄，以获得更丰富的视觉细节。这些特性对标准SfM算法提出了新的挑战。首先，大多数可用的全局或增量SfM方案都是基于单个摄像机的，因此不能直接恢复比例。更重要的是，由于视场的限制，相邻图像之间的重叠区域被缩小，从而导致姿态图只能局部连通，从而影响运动估计的精度。这个问题在大规模环境中变得更加重要。

为了解决上述挑战本文提出了一种新的方案，它扩展了传统的SfM算法，使之适用于立体相机和LiDAR传感器。这项工作基于一个简单的想法，即激光雷达的远距离能力可以用来抑制图像之间的相对运动。更具体地说，我们首先实现了一个立体视觉SfM方案，它计算摄像机的运动并估计视觉特征（结构）的三维位置。然后将激光雷达点云和视觉特征融合到一个单一的优化函数中，迭代求解该优化函数以最优化相机的运动和结构。在我们的方案中，LiDAR数据从两个方面增强了SfM算法：

1）LiDAR点云用于检测和排除无效的图像匹配，使基于立体相机的SfM方案对视觉模糊具有更强的鲁棒性；

2）LiDAR点云与视觉特征在联合优化框架中相结合，以减少运动漂移。我们的方案可以实现比最先进的SfM算法更一致和更精确的运动估计。

本文的工作主要有以下几个方面：

1）将全局SfM技术应用于立体摄像系统，实现了摄像机在真实尺度下的运动初始化。

2）激光雷达数据被用来排除无效的图像匹配，进一步加强了方案的可靠性。

3）通过联合立体相机和激光雷达的共同的数据，扩展了我们先前提出的联合优化方案，提高了所建模型的精度和一致性。

激光雷达增强的双目SFM

该方案以一组立体图像和相关的LiDAR点云作为输入，以三角化特征点和合并的LiDAR点云的格式生成覆盖环境的三维模型。下图显示了我们的LiDAR增强SfM方案的过程

光雷达增强的双目SFM方案

A、对应特征点搜索

给定立体图像对，计算对应关系包括特征提取、匹配和几何验证。首先，我们依赖OpenMVG库从图像中提取SIFT特征。然后使用所提供的级联哈希方法对特征进行穷尽匹配。最后，通过对双目极线约束进行几何的验证，验证了两幅图像之间的匹配。具体地说，利用RANSAC估计基本矩阵F，然后用来检查匹配特征的极线误差。只保留几何上一致的特征，以便进一步计算。

B、相对运动估计

由于立体图像对是预先校准的，所以我们将一对左右图像作为一个独立的单元，为了估计相对运动，标准的立体匹配方法依赖于两对图像中所有四幅图像所观察到的特征点，而我们观察到许多点只被三幅甚至两幅图像共享。忽略这些点可能会丢失估计相机运动的重要信息，特别是在图像重叠有限的情况下。因此，这里选择显式地处理两个位姿点之间共享视图的不同情况。具体来说，我们考虑至少3个视图共享的特征点，以确保尺度的重建。虽然只有2个视图的点可以帮助估计旋转和平移方向，但是由于这些点通常来自于下图所示的小重叠区域，所以这里忽略它们。另一方面，两个位姿点之间也可能存在多种类型的共享特性。为了简化问题，我们选择对应关系最多的类型来求解相对运动。在三视图情况下，首先用立体图像对，对特征点点进行三角化，然后用RANSAC+P3P算法求解。在四视图的情况下，我们遵循标准的处理方法，首先对两个站点中的点进行三角化，然后应用RANSAC+PCA配准算法找到相对运动。在这两种情况下，都使用非线性优化程序来优化计算的姿态和三角化，通过最小化内线的重投影误差。最后，对所有姿态进行变换以表示左摄像机之间的相对运动。

两视图要素的区域示例。左：一位姿右图像；中右：另一位姿的左右图像。共同的小区域靠近边界并用红框标记。

两个位姿点（红色和蓝色圆圈对）之间共享特征（灰点）的示例。彩色条表示已知的校准后的立体图像对。（a）-（d）三视图；（e）四视图。

C、相对运动验证

一旦找到了相对运动，就可以建立一个姿态图，其中节点表示图像帧的姿态，边表示相对运动。全局姿态可以通过平均位姿图上的相对运动来求解。然而，由于环境中的视觉模糊性（见下图），可能存在无效的边缘，并且直接平均相对运动可能会产生不正确的全局姿势。因此，设计了一个两步边缘验证方案来去除异常值。

（1）在第一步中，检查所有图像帧对的激光雷达点云的重叠，并剔除不一致的点云。

（2）第二步中检查回环的一致性。（具体方法可在论文中有详细说明）

由于视觉模糊导致的无效相对运动的例子。（a）由于相同的停车标志，两对图像匹配不正确。（b）相应的点云来自两个车站，标志用红框标出。（c）合并的占用网格显示不正确的对齐方式（红色椭圆）。在这种情况下，一致性比为0.56，而有效相对运动的一致性比通常超过0.7

D、全局位姿初始化

这部分主要介绍优化全局帧的代价函数：

E、三角化与RANSAC

本文采用文鲁棒三角化方法，对每个三维特征点使用RANSAC来寻找最佳的三角化视图。对于每个轨迹，它是不同相机视图中一个特征点的观察值的集合，随机对两个视图进行采样，并使用DLT方法对该点进行三角化。通过将该点投影到其他视图上并选择具有较小重投影误差的视图，可以找到更匹配的视图。此过程重复多次，并保留最大的一组内部视图（至少需要3个视图）。最后，通过最小化重投影误差，利用内联视图优化特征点在全局结构中的位姿。

F、联合位姿优化

基于视觉的SfM算法的位姿优化通常通过束调整（BA）来实现。然而，由于多个系统原因，如特征位置不准确、标定不准确、对应异常值等，位姿估计在长距离内可能会产生较大的漂移，尤其是在无法有效地发现闭合环路的情况下。为了解决这个问题，我们考虑利用激光雷达的远距离能力来限制相机的运动，该方案将相机机和激光雷达观测值联合最优化。这部分内容可查看原文理解公式。

实验结果

A、实验装置

下图具有多个机载传感器，包括两个Ximea彩色摄像头（1200万像素，全局快门）和一个安装在连续旋转电机上的Velodyne Puck激光雷达（VLP-16）。利用编码器测量的电机角度，将VLP-16的扫描点转换成固定的基架。

传感器盒子和数据集。

B、相对运动估计

上图：从4个视图和3个视图点显示求解的对数。下图：不同三元组检查的边数直方图。

左图：初始化的位姿图有4个视图特征。右：使用多视图初始化位姿图

C、相对运动验证

这里比较了所提出的基于网格的检查（GC，阈值为0.6）和成功率检查（SR）与OpenMVG使用的旋转循环检查和transform（旋转和平移）循环检查（TC）的异常值排除法的性能。

D、联合测量

这里展示联合观测建模在联合优化中的优势。如下图所示

激光雷达点云（灰色）与重建视觉特征（红色）叠加。左：没有联合观测。右：联合观测。

E、重建

对收集到的数据集的重建结果下图所示。在第一行，展示了小型混凝土结构的重建。第二行比较了使用COLMAP、OpenMVG和我们的方案Smith-Hall重建结果。在这三个测试中，使用左右图像进行重建。然而，COLMAP和OpenMVG都无法处理由停车标志，和有限的重叠图像造成的视觉模糊。因此，生成的模型要么不一致，要么不完整。使用我们的方案有助于有效地排除无效的运动，并允许建立一个更一致的模型。

重建的结果对比

总结

本文提出了一种利用激光雷达信息提高立体SfM方案的鲁棒性、准确性、一致性和完备性的LiDAR增强立体SfM方案。实验结果表明，该方法能有效地找到有效的运动位姿，消除视觉模糊。此外，实验结果还表明，结合相机和激光雷达的联合观测有助于完全约束外部变换。最后，与最先进的SfM方法相比，LiDAR增强SfM方案可以产生更一致的重建结果。

资源

三维点云论文及相关应用分享

【点云论文速读】基于激光雷达的里程计及3D点云地图中的定位方法

3D目标检测：MV3D-Net

三维点云分割综述（上）

3D-MiniNet: 从点云中学习2D表示以实现快速有效的3D LIDAR语义分割（2020）

win下使用QT添加VTK插件实现点云可视化GUI

JSNet：3D点云的联合实例和语义分割

大场景三维点云的语义分割综述

PCL中outofcore模块---基于核外八叉树的大规模点云的显示

更多文章可查看：点云学习历史文章大汇总

SLAM及AR相关分享

【开源方案共享】ORB-SLAM3开源啦！

【论文速读】AVP-SLAM：自动泊车系统中的语义SLAM

【点云论文速读】StructSLAM:结构化线特征SLAM

SLAM和AR综述

常用的3D深度相机

AR设备单目视觉惯导SLAM算法综述与评价

SLAM综述(4)激光与视觉融合SLAM

Kimera实时重建的语义SLAM系统

SLAM综述(3)-视觉与惯导，视觉与深度学习SLAM

无人车业务中的视觉三维重建

业务背景 1.1 自动驾驶与高精度地图高精地图也称为高分辨率地图(High Definition Map, HDMap)或者高度自动驾驶地图(Highly Automated Driving Map ...
汽车传感行业现状：复杂而充满魅力

热议汽车感测之选择和挑战过去五年里,关于自动驾驶(AV)和对移动性未来发展的种种炒作,使我们一开始就没有意识到它有多么难.现在,正弦波的弹性运动恰好可以让我们重新审视原来的目标. 在面向打造车辆感知 ...
苹果手机12激光雷达有什么用

苹果12激光雷达扫描仪的作用是精准测距,LIDAR扫描仪同时拥有激光发生器.激光接收器,原理便是将激光发射出去,当激光接触到实际物体之后会形成反射,此后接收器便能够感受到被反射的激光. 苹果12激光雷 ...
激光雷达行业报告

LiDAR技术是一种主动式遥感系统,这意味着该系统本身产生的能量将以快速发射激光的形式出现,以测量范围和地球表面物体的确切距离. 一个LiDAR传感器有3个主要组成部分: 激光,发出并传输脉冲扫描器 ...
外媒又曝出iPhone13的三个新消息，仅一个值得点赞，两个令人失望

不出意外的话,苹果的年度大戏-iPhone13系列机型将在9月份的秋季发布会上和我们见面.苹果预计今年可以售出9000万台iPhone13系列,面对如此巨大的需求量,供应链也已经为iPhone13系列 ...
收藏 | SLAM快速入门

仅做学术分享,如有侵权,联系删除转载于 :作者 | Channon@CSDN https://blog.csdn.net/Cai_deLong/article/details/108465850 0 ...
Camera-Lidar投影：2D-3D导航

重磅干货,第一时间送达图1.图像上的激光雷达点激光雷达和照相机是用于感知和理解场景的两个基本传感器.他们建立周边环境模型.提供检测和确定其他对象位置的方法,从而为机器人提供了安全导航所需的丰富语义 ...
Transformer拿下CV顶会大奖，微软亚研获ICCV 2021最佳论文

机器之心报道机器之心编辑部 ICCV 2021 全部奖项已经公布,来自微软亚洲研究院的研究者获得 ICCV 2021 马尔奖(最佳论文):最佳学生论文奖由苏黎世联邦理工学院.微软研究者获得. 10 ...
基于显著增强多模式池的图像成分评估

重磅干货,第一时间送达小黑导读论文是学术研究的精华和未来发展的明灯.小黑决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...
全球首款基于激光雷达的3D全息抬头显示器，可以提升道路安全性

英国研究人员利用激光雷达(LiDAR)创建物体的高清全息图像,并将其投射入驾驶员的眼睛. 据麦姆斯咨询报道,英国研究人员面向汽车应用开发出首个基于激光雷达(LiDAR)的3D全息抬头显示器.通过对这项 ...
BEFD：基于边界增强和特征去噪的血管分割

点击上方"深度学习爱好者",选择加"星标"或"置顶" 重磅干货,第一时间送达小黑导读论文是学术研究的精华和未来发展的明灯.小黑决心每天为 ...
基于RGB-D相机的三维重建总览：静态与动态三维重建

" 近年来,随着AR,VR,虚拟试衣,自动驾驶等领域的兴起,三维重建技术得到了广泛的应用.今天分享一篇来自三维匠心的关于三维重建的综述文章.文章较长,建议收藏. " 三维匠心(已授 ...
基于结构光投影三维重建：格雷码编码与解码

本文作者:飒白本文链接: https://www.cnblogs.com/sabai/p/14626150.html 一单目结构光编码目的类似于双目,如果把投影仪看成一个逆相机,直到空间中的一点 ...
点云论文速读】基于激光雷达的里程计及3D点云地图中的定位方法

标题:LOL: Lidar-only Odometry and Localization in 3D point cloud maps 作者:David Rozenberszki and Andr ´ ...
基于激光雷达的传感器验证

自动驾驶汽车3D实时感知系统的世界领导者Velodyne LiDAR公司2017年曾成为世界上最大的汽车安全公司Autoliv公司的一级供应商, 并将使用Velodyne的核心3D软件技术和专有的Li ...
F-LOAM:基于激光雷达的快速里程计和建图

文章:F-LOAM : Fast LiDAR Odometry and Mapping 作者:Han Wang, Chen Wang, Chun-Lin Chen, and Lihua Xie git ...
最全综述：基于深度学习的三维重建算法

前言目前,三维重建技术已在游戏.电影.测绘.定位.导航.自动驾驶.VR/AR.工业制造以及消费品领域等方面得到了广泛的应用.方法同样也层出不穷,我们将这些方法依据原理分为两类: 基于传统多视图几何的 ...

基于激光雷达增强的三维重建

相关推荐