RandLA-Net:高效的大规模点云语义分割
标题:RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds
作者:Hu, Qingyong,Yang, Bo,Xie, Linhai,Rosa, Stefano,Guo, Yulan,Wang, Zhihua
来源:CVPR2020 牛津大学、中山大学、国防科技大学
翻译:吉祥街
欢迎各位加入免费知识星球,获取PDF论文,欢迎转发朋友圈分享快乐。
论文阅读模块将分享点云处理,SLAM,三维视觉,高精地图相关的文章。公众号致力于理解三维视觉领域相关内容的干货分享,欢迎各位加入我,我们一起每天一篇文章阅读,开启分享之旅,有兴趣的可联系微信dianyunpcl@163.com。
贡献
验证了随机采样在大规模场景点云处理上能够有效的节省时间。
提出了一个有效的基于注意力机制的局部特征聚合模块LAF(Local Feature Attention),通过逐步增加每个点的感受野来保持复杂的局部结构。
表现sota
特点
端到端训练,不需要额外的预处理和后处理步骤。
直接对点进行操作
实时性增快200x
RandLA-Net
点采样方法
任务描述:从具有N个点的大规模点云P中采样K个点。
启发式采样

基于学习的采样

LFA(Local Feature Attention):局部特征聚合模块
目的描述:弥补随机采样会造成某些关键特征丢失,提出了一个有效的基于注意力机制的局部特征聚合模块。
局部特征聚合模块由三个神经单元组成:
LocSE(Local Spatial Encoding):局部空间编码模块
Attentive Pooling:注意力池化
Dilated Residual Block:扩张残差块

LocSE(Local Spatial Encoding):局部空间编码模块
对输入的点云的三维坐标进行编码。
Attentive Pooling:注意力池化
采用注意力池化,将上层输入的局部邻域点集特征进行聚合。
Dilated Residual Block:扩张残差块
采用两种方式来增大感受野:
1)LocSE + Attentive Pooling
2)跳层连接

红色点在经过一次LA操作后感受野为K个相邻点,经过第二次LA后,感受野为K^2个邻域点。
整体结构

整体采用encoder-decoder结构,并将RS与LFA组合。解码器阶段采用最近邻插值,来提升算法效率。
实验
实验一:验证随机采样的有效性

实验二:验证RandLA-Net的有效性

实验三:基准数据集评估结果
Semantic3D

SemanticKITTI

S3DIS

实验四:消融实验

资源
三维点云论文及相关应用分享
【点云论文速读】基于激光雷达的里程计及3D点云地图中的定位方法
3D-MiniNet: 从点云中学习2D表示以实现快速有效的3D LIDAR语义分割(2020)
PCL中outofcore模块---基于核外八叉树的大规模点云的显示
更多文章可查看:点云学习历史文章大汇总
SLAM及AR相关分享