【每周CV论文推荐】 初学深度学习图像分割必须要读的文章

欢迎来到《每周CV论文推荐》。在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的。

图像分割作为计算机视觉的基础任务之一,应用非常广泛,今天给大家推荐初学深度学习图像分割必读的一些文章。

作者&编辑 | 言有三

1 FCN

Fully Convolutional Network(FCN)作为公认的卷积神经网络用于图像分割任务的鼻祖,当然是入门首选。

文章引用量:10000+

推荐指数:✦✦✦✦✦

[1] Long J, Shelhamer E, Darrell T. Fully convolutional networks for semantic segmentation[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2015: 3431-3440.

2 UNet与SegNet

UNet和SegNet两个模型都是对称的编解码结构,与FCN是同一时期的图像分割模型,都是最经典的网络架构之一。

文章引用量:7000+

推荐指数:✦✦✦✦✦

[2] Badrinarayanan V, Kendall A, Cipolla R. Segnet: A deep convolutional encoder-decoder architecture for image segmentation[J]. IEEE transactions on pattern analysis and machine intelligence, 2017, 39(12): 2481-2495.

[3] Ronneberger O, Fischer P, Brox T. U-net: Convolutional networks for biomedical image segmentation[C]//International Conference on Medical image computing and computer-assisted intervention. Springer, Cham, 2015: 234-241.

3 DenseCRF与Deeplab

在深度学习应用于图像分割之前,基于CRF的Graph Cuts(图割)算法才是王者。

Deeplab[5]将DenseCRF[4]应用于分割结果的后处理改进,CRFasRNN[6]则将其直接融合到CNN模型中。

其中,在Deeplab中还在图像分割网络中使用了带孔卷积,文[7]则首次在网络中系统性使用带孔卷积。

文章引用量:9000+

推荐指数:✦✦✦✦✦

[4] Krähenbühl P, Koltun V. Efficient inference in fully connected crfs with gaussian edge potentials[C]//Advances in neural information processing systems. 2011: 109-117.

[5] Chen L C, Papandreou G, Kokkinos I, et al. Semantic image segmentation with deep convolutional nets and fully connected crfs[J]. arXiv preprint arXiv:1412.7062, 2014.

[6] Zheng S, Jayasumana S, Romera-Paredes B, et al. Conditional random fields as recurrent neural networks[C]//Proceedings of the IEEE international conference on computer vision. 2015: 1529-1537.

[7] Yu F, Koltun V. Multi-scale context aggregation by dilated convolutions[J]. arXiv preprint arXiv:1511.07122, 2015.

4 ParseNet和PSPNet

多尺度和特征融合对于语义分割任务非常重要,ParseNet[8]使用了全局特征和局部特征融合的方案,PSPNet[9]则使用了多尺度的池化特征,都是早期比较经典的模型。

文章引用量:600+

推荐指数:✦✦✦✦✧

[8] Liu W, Rabinovich A, Berg A C. Parsenet: Looking wider to see better[J]. arXiv preprint arXiv:1506.04579, 2015.

[9] Zhao H, Shi J, Qi X, et al. Pyramid scene parsing network[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017: 2881-2890.

5 如何获取文章与交流

找到有三AI开源项目即可获取。

https://github.com/longpeng2008/yousan.ai

文章细节众多,阅读交流在有三AI知识星球中进行,感兴趣可以加入。

总结

以上就是初次学习图像分割需要读的文章,下一次,我们将推荐入门GAN需要读的文章。

有三AI夏季划

有三AI夏季划进行中,欢迎了解并加入,系统性成长为中级CV算法工程师。

转载文章请后台联系

侵权必究

(0)

相关推荐