分割、检测与定位,高分辨率网络显神威!这会是席卷深度学习的通用结构吗?


52CV曾经第一时间报道过CVPR2019 | 微软、中科大开源基于深度高分辨表示学习的姿态估计算法,此后该文引起不少媒体的关注。

当时CV君发现,该论文《Deep High-Resolution Representation Learning for Human Pose Estimation》的原作者不仅把这种高分辨率网络结构用于姿态估计,也在尝试用于其他方向。

不久前,作者在新论文《High-Resolution Representations for Labeling Pixels and Regions》中对网络结构进行了v2版本升级,给出了更多实验结果,更加验证了该网络结构的价值!

在计算机视觉目前最热门应用领域语义分割、目标检测、人脸特征点定位中,换用高分辨率网络结构的算法都获得了显著的精度提升!

作者信息:

http://cn.arxiv.org/pdf/1904.04514.pdf

作者分别来自中国科技大学、微软亚研院、阿德莱德大学、北京大学、华中科技大学。

在新出的这篇文章中,作者的将HRNet进行了升级,使之衍生出的高分辨率网络结构能够适用于目前state-of-the-art的语义分割、目标检测、人脸特征点定位算法中的网络结构。

下图为高分辨率网络的简单结构示例:

网络前向不断维护高分辨率的表示的同时,并行的存在低分辨率的多个表示,在每个stage结束,并行的高低分辨率网络以类似全连接的方式进行信息融合。

下图为HRNet网络更新的示例:

(a)上原始高分辨率网络论文中的结构,当时该结构仅在高分辨率网络分支上进行姿态估计。(b)为将不同分辨率网络分支串联的示意图,在新的论文中用于语义分割和人脸特征点检测(记为HRNetV2),不同的颜色代表不同分辨率网络的流向结果。(c)为在(b)基础上进一步衍生出的高分辨率网络特征金字塔结构。

作者在语义分割、目标检测、人脸特征点检测三个视觉任务多个数据集上进行了实验,当算法用上高分辨率网络均获得了显著的精度提升,同时计算量和参数量下降,验证了高分辨率网络改进视觉任务的通用性。也就是意味着大家以后设计自己的网络结构直接上HRNet,基本错不了!

我们一起来看看吧!~

作者的确是很用心,从目前看到的结果看,HRNet要成为网络结构升级的通用结构,席卷深度学习领域了!

作者不仅报告了结果,还把代码开源了!

开源地址:

https://github.com/HRNet

作者分四个方向放出了源代码和预训练模型,大家可以下载测试下。

在你的研究工作中试试HRNet吧,它看起来真的很有前途!

加群交流

(0)

相关推荐