MPASNET：用于视频场景中无监督深度人群分割的运动先验感知SIAMESE网络

2024-06-04 04:23:44

重磅干货，第一时间送达

小白导读

论文是学术研究的精华和未来发展的明灯。小白决心每天为大家带来经典或者最新论文的解读和分享，旨在帮助各位读者快速了解论文内容。个人能力有限，理解难免出现偏差，建议对文章内容感兴趣的读者，一定要下载原文，了解具体内容。

摘要

人群分割是拥挤场景分析的基础任务，获取精细的像素级分割图是人们非常希望实现的。然而，这仍然是一个具有挑战性的问题，因为现有的方法要么需要密集的像素级注释来训练深度学习模型，要么仅仅从光学或粒子流与物理模型生成粗略的分割地图。在本文中，作者提出了运动先验感知Siamese网络(MPASNET)用于无监督人群语义分割。这个模型不仅消除了注释的需要，而且产生了高质量的分割图。特别地，作者首先分析帧间的相干运动模式，然后对集合粒子采用圆形区域合并策略生成伪标记。此外，作者为MPASNET配备了siamese分支，用于增强不变正则化和siamese特征聚合。在基准数据集上的实验表明，作者的模型在mIoU方面的性能优于目前最先进的模型12%以上。

MPASNET与以往方法的比较

论文创新点

据作者所知，这项工作是第一个专注于人群分割的基于无监督深度学习的模型。作者的贡献总结如下:

作者重新讨论了基于运动相似度的方法，并提出了以集体运动粒子为中心的掩模圆形区域合并来产生近似的标注用于深度人群分割。
作者设计了一个端到端的暹罗网络和相关的损耗函数来学习自生成的伪标签。
作者在两个有代表性的数据集上评估了作者的无监督方法，显著优于最先进的方法。

框架结构

提出的MPASNET结构。(a)以增广图像为输入的暹罗分支。(b)暹罗特征聚合。(c)运动引导圆形区域合并的伪标记。(d)分割头。

实验结果

与最新方法的定性比较。(一)原始帧。(b) CM[4]提取的运动粒子。(c) CrowdRL的分割结果。(d) CM合成的圆形区域合并伪标签。(e) MPASNET分割结果。(f)地面真理。作者的方法比其他方法有了明显的改进。

在IoU方面与最新方法的定量比较。MPASNET*表示没有siamese分支的训练MPASNET(即没有augmented - invariant regularization and siamese feature aggregation)。

每个成分的影响。AIR：增广不变正则化。SFA：Siamese特性聚合。Dice:Dice损失。CE：交叉熵损失。

结论

在本文中，作者提出了用于无监督深度人群语义分割的MPASNET。与现有的方法不同，作者的模型利用运动先验生成伪标签，无需人工操作，从而学习在缺乏地面真相的情况下生成高质量分割地图。实验表明，与最先进的无监督方法相比，作者的框架取得了实质性的改进。

论文链接：https://arxiv.org/pdf/2101.08609.pdf

每日坚持论文分享不易，如果喜欢我们的内容，希望可以推荐或者转发给周围的同学。

【泡泡一分钟】基于无监督网络的单幅图像深度估计与分割多任务学习

每天一分钟,带你读遍机器人顶级会议文章标题:Multi-Task Learning for Single Image Depth Estimation and Segmentation Based ...
【模型解读】深度学习网络只能有一个输入吗

继续我们之前的专栏<模型解读>,今天说多输入网络,很久没写了因为实在是有更重要的事情. 平常我们所见的深度学习模型,都是输入一个图像或者视频序列,输出分类,分割,目标检测等结果,但是还有一 ...
你读那么多CV论文有什么用，还不如我复现 1 篇！

深度之眼招募人工智能Paper讲师,兼职时间一年可赚30w,招聘详情见文章底部. 学计算机视觉千万不能错过图像分割! 它是图像理解领域关注的一个热点! 是图像分析的第一步! 是图像理解的基础,也是图像 ...
深度神经网络的图像语义分割研究综述

摘要随着深度学习的迅速发展并广泛应用到语义分割领域,语义分割效果得到了显著的提升.本文主要对基于深度神经网络的图像语义分割方法和研究现状进行了详细的综述.根据网络训练方式的不同,将现有的方法分为 ...
【视频课】图像分割最新内容来了（言有三新录制6大理论部分+1个案例实践讲解）

课程介绍图像分割在直播,电商,自动驾驶等行业中有着广泛的应用,有三AI此前推出了<深度学习之图像分割-理论实践篇>课程,让你以最短的时间掌握深度学习图像分割的基础知识并进行代码实践. 我 ...
深圳大学梁臻博士提出EEGFuseNet高维脑电图混合无监督深度特征表征与融合模型及其在情绪识别中的应用

近期,深圳大学医学部生物医学工程学院梁臻博士(张治国教授团队MIND LAB核心成员)提出一种实用的基于无监督学习的卷积循环混合生成对抗网络,用以实现有效的脑电特征表征与融合,简称为EEGFuseNe ...
DetCo：用于目标检测的无监督对比学习

重磅干货,第一时间送达小白导读论文是学术研究的精华和未来发展的明灯.小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...
【泡泡点云时空】实时的多机SLAM系统：用于动态场景中的定位和3D建图

泡泡点云时空,带你精读点云领域顶级会议文章标题:Real-Time Multi-SLAM System for Agent Localization and 3D Mapping in Dynami ...
BMVC18|无监督深度关联学习大幅提高行人重识别性能（附Github地址）

本文选自BMVC2018的论文<Deep Association Learning for Unsupervised Video Person Re-identification>,使用无 ...
TricycleGAN：基于形状先验的无监督图像合成和分割

重磅干货,第一时间送达小白导读论文是学术研究的精华和未来发展的明灯.小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...
最新开源无监督单目深度估计方法，解决复杂室内场景难训练问题，效果性能远超SOTA

加入极市专业CV交流群,与 10000+来自港科大.北大.清华.中科院.CMU.腾讯.百度等名校名企视觉开发者互动交流! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总,行业技术交流.关注 ...
【泡泡一分钟】无监督几何感知深度激光雷达里程计

每天一分钟,带你读遍机器人顶级会议文章标题:Unsupervised Geometry-Aware Deep LiDAR Odometry 作者:Younggun Cho, Giseop Kim a ...
FAIR最新无监督研究：视频的无监督时空表征学习

设为星标,干货直达! 机器学习算法工程师机器学习.深度学习.数据挖掘等人工智能领域的技术实战干货文章,这里都有!分享从业经验是我们的不变的准则-- 567篇原创内容公众号近期,FAIR的Kaim ...
基于深度学习的无监督磁共振图像去噪方法

MRI图像是一种以不同灰度显示不同结构的解剖和病理的断面图像,广泛应用于疾病的检测.诊断以及治疗监测.然而,MRI图像的成像过程往往伴随着随机噪声,这导致了低质MRI图像的产生.MRI图像的质量不仅会 ...

MPASNET：用于视频场景中无监督深度人群分割的运动先验感知SIAMESE网络

相关推荐