极市直播回放丨第76期-许鸿斌:AAAI'21杰出论文,一个解决三维重建对数据依赖的新框架(已开源)

多视图立体几何(Multi-view Stereo, MVS)是一种很经典的三维重建方法,旨在从多视角图像中恢复场景的三维信息。近年来,越来越多的工作开始将深度学习与传统的多视图立体几何方法结合,以提升三维重建的精度,如MVSNet、R-MVSNet等。尽管深度学习的强大表征能力可以带来显著的性能提升,但是其对于数据的依赖却十分严重,需要大量的数据以及Ground Truth来训练神经网络。在现实场景下,三维的Ground Truth较难获取,采集标注成本很高,给基于深度学习的三维重建带来了不小的困难。
在这次分享中,我们邀请到了来自华南理工大学的许鸿斌,为我们介绍他团队在AAAI 2021上的工作
Self-supervised Multi-view Stereo via Effective Co-segmentation and Data-Augmentation。
此前的自监督三维重建方法都是基于颜色一致性假设,即匹配点具有相同的颜色。然而这一假设在自然场景下却难以成立,因为不同视角图像之间天然存在的光照差异等干扰,导致匹配点间具有不同的颜色。这可能会导致自监督信号失效,无法有效地起到监督作用,我们称其为颜色一致性歧义问题。针对这一问题,他们团队在自监督训练框架中引入协同分割和数据增强策略:通过协同分割挖掘多视角之间的共有抽象语义,并设计了一个语义一致性损失;通过将自监督训练拓展为双阶段,引入数据增强一致性损失。
在极市平台公众号后台回复“76”或“许鸿斌”即可获取PPT下载地址~
➤详情传送门

极市直播|AAAI'21杰出论文许鸿斌:一个解决三维重建对数据依赖的新框架(已开源)

➤论文地址

Self-supervised Multi-view Stereo via Effective Co-segmentation and Data-Augmentation

论文地址:

https://www.aaai.org/AAAI21Papers/AAAI-2549.XuH.pdf

➤分享大纲

1、背景知识(基于深度学习的MVS方法,自监督的MVS方法)

2、存在的核心问题(颜色一致性歧义问题)

3、我们的方法(基于协同分割与数据增强的自监督训练框架)

4、实验分析

5、总结与展望

➤回放视频在这里☟(建议在pc端观看)

➤部分PPT截图

(0)

相关推荐

  • 通过对比对象掩码建议的无监督语义分割

    重磅干货,第一时间送达 小白导读 论文是学术研究的精华和未来发展的明灯.小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...

  • SiT:自我监督的视觉transformer

    点击上方"深度学习爱好者",选择加"星标"或"置顶" 重磅干货,第一时间送达 小黑导读 论文是学术研究的精华和未来发展的明灯.小黑决心每天为 ...

  • 【AAAI2021】缓解语言模型政治偏见

    当前的大规模语言模型可能由于其训练数据而产生政治偏见,当将它们部署在现实环境中时可能会导致严重的问题. 在本文中,我们提出了用于衡量GPT-2生成中的政治偏见的指标,并提出了一种强化学习(RL)框架, ...

  • UFA-FUSE:一种用于多聚焦图像融合的新型深度监督混合模型

    点击上方"深度学习爱好者",选择加"星标"或"置顶" 重磅干货,第一时间送达 小白导读 论文是学术研究的精华和未来发展的明灯.小白决心每天为 ...

  • 跨模态学习在三维语义分割领域适应中的应用

    重磅干货,第一时间送达 小白导读 论文是学术研究的精华和未来发展的明灯.小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...

  • AAAI 2021线上分享 | BERT模型蒸馏技术,阿里云有新方法

    通过在下游 NLP 任务上的微调,BERT.XLNet 和 RoBERTa 等预训练语言模型已经展示出了卓越的性能.但是,这些模型中的大量参数导致储存和计算成本过高,从而对模型在资源受限应用场景中的部 ...

  • DSC-PoseNet:通过双尺度一致性学习6DoF物体姿态估计

    点击上方"深度学习爱好者",选择加"星标"或"置顶" 重磅干货,第一时间送达 小黑导读 论文是学术研究的精华和未来发展的明灯.小黑决心每天为 ...

  • AAAI 2021:基于对比自监督学习的图分类

    本文转自 MIND Laboratory微信公众号,原文地址 https://mp.weixin.qq.com/s/nB-hUPeiRcDiSd6uja6rUQ Contrastive Self-su ...

  • TraND:无监督跨域步态识别的可转移邻域发现

    重磅干货,第一时间送达 小白导读 论文是学术研究的精华和未来发展的明灯.小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...

  • 多视图立体匹配论文分享 | Fast-MVSNet

    论文题目:Fast-MVSNet: Sparse-to-Dense Multi-View Stereo with Learned Propagation and Gauss-Newton Refine ...

  • 对话摘要简述

    作者:哈工大SCIR 冯夏冲 对话摘要任务在近两年得到了工业界和学术界的广泛关注.随着社会的发展和通讯技术的进步,对话数据日益增多,并且迸发出不同的形式:会议.邮件.闲聊.讨论.辩论等等.不同形式的对 ...

  • DeepQAMV:用于多视频摘要的查询感知层次指针网络

    重磅干货,第一时间送达 小黑导读 论文是学术研究的精华和未来发展的明灯.小黑决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...

  • 多视图立体匹配论文分享:BlendedMVS

    作者:Toddi-Qi 来源:微信公众号|3D视觉工坊(系投稿) 论文题目:BlendedMVS: A Large-scale Dataset for Generalized Multi-view S ...