RandLA-Net:高效的大规模点云语义分割 / 开普饭

标题：RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds

作者：Hu, Qingyong，Yang, Bo，Xie, Linhai，Rosa, Stefano，Guo, Yulan，Wang, Zhihua

来源：CVPR2020 牛津大学、中山大学、国防科技大学

翻译：吉祥街

欢迎各位加入免费知识星球，获取PDF论文，欢迎转发朋友圈分享快乐。

论文阅读模块将分享点云处理，SLAM，三维视觉，高精地图相关的文章。公众号致力于理解三维视觉领域相关内容的干货分享，欢迎各位加入我，我们一起每天一篇文章阅读，开启分享之旅,有兴趣的可联系微信dianyunpcl@163.com。

贡献

验证了随机采样在大规模场景点云处理上能够有效的节省时间。
提出了一个有效的基于注意力机制的局部特征聚合模块LAF(Local Feature Attention)，通过逐步增加每个点的感受野来保持复杂的局部结构。
表现sota

特点

端到端训练，不需要额外的预处理和后处理步骤。
直接对点进行操作
实时性增快200x

RandLA-Net

点采样方法

任务描述：从具有N个点的大规模点云P中采样K个点。

启发式采样

基于学习的采样

LFA（Local Feature Attention）：局部特征聚合模块

目的描述：弥补随机采样会造成某些关键特征丢失，提出了一个有效的基于注意力机制的局部特征聚合模块。

局部特征聚合模块由三个神经单元组成：

LocSE（Local Spatial Encoding）：局部空间编码模块
Attentive Pooling：注意力池化
Dilated Residual Block：扩张残差块

LocSE（Local Spatial Encoding）：局部空间编码模块

对输入的点云的三维坐标进行编码。

Attentive Pooling：注意力池化

采用注意力池化，将上层输入的局部邻域点集特征进行聚合。

Dilated Residual Block：扩张残差块

采用两种方式来增大感受野：

1）LocSE + Attentive Pooling

2）跳层连接

红色点在经过一次LA操作后感受野为K个相邻点，经过第二次LA后，感受野为K^2个邻域点。

整体结构

整体采用encoder-decoder结构，并将RS与LFA组合。解码器阶段采用最近邻插值，来提升算法效率。

实验

实验一：验证随机采样的有效性

实验二：验证RandLA-Net的有效性

实验三：基准数据集评估结果

Semantic3D

SemanticKITTI

S3DIS

实验四：消融实验

资源

三维点云论文及相关应用分享

【点云论文速读】基于激光雷达的里程计及3D点云地图中的定位方法

3D目标检测：MV3D-Net

三维点云分割综述（上）

3D-MiniNet: 从点云中学习2D表示以实现快速有效的3D LIDAR语义分割（2020）

win下使用QT添加VTK插件实现点云可视化GUI

JSNet：3D点云的联合实例和语义分割

大场景三维点云的语义分割综述

PCL中outofcore模块---基于核外八叉树的大规模点云的显示

更多文章可查看：点云学习历史文章大汇总

SLAM及AR相关分享

【开源方案共享】ORB-SLAM3开源啦！

【论文速读】AVP-SLAM：自动泊车系统中的语义SLAM

【点云论文速读】StructSLAM:结构化线特征SLAM

SLAM和AR综述

常用的3D深度相机

AR设备单目视觉惯导SLAM算法综述与评价

SLAM综述(4)激光与视觉融合SLAM

Kimera实时重建的语义SLAM系统

SLAM综述(3)-视觉与惯导，视觉与深度学习SLAM

RandLA-Net:高效的大规模点云语义分割

相关推荐