【图像分类】分类专栏正式上线啦!初入CV、AI你需要一份指南针!

大家好,今天我将在有三AI开设新专栏《图像分类》。在这个专栏中,我将全方位介绍图像分类相关知识,并结合不同任务需求进行实战,和大家一同走近这看似简单却包罗万象的基础性技术,同时指导计算机视觉、深度学习领域的初学者快速、准确、全面地掌握图像分类的相关知识。

作者&编辑 | 郭冰洋

1 图像分类简介

图像分类,即通过某种分类算法使计算机判断输入图像所属的类别。作为计算机视觉的基础性任务,图像分类是后续目标检测、图像分割的重要基础,几乎所有的工作都建立在图像分类之上。近年来,随着深度学习的发展,图像分类取得了显著进步,并在许多数据集上达到了超越人类的水准。越来越多的人们也开始重视对图像分类和深度学习的研究。

2 专栏目录与内容

目前,众多教材和课程均以图像分类作为深度学习的入门基础,本专栏的开设目的也在于引导初学者快速、准确地进入计算机视觉领域和深度学习领域,为后续的工作打下一个良好的基础。

目前,图像分类专栏内容规划如上图所示,采用理论和实战相结合的方法,针对子专题所涉及到的内容,均会进行相应的实践操作,加深并强化知识的理解。

1、多类别图像分类

专栏将由最基本的多类别图像分类为基础,介绍传统的CNN分类网络及其相应的特点,并动手搭建一个多类别图像分类网络,将涉及到图像数据读取、神经网络搭建、评价指标计算等多个部分,通过完整的实战实现图像处理和深度学习的入门。

进行完初始的网络搭建之后,我们将介绍提升网络性能的相关策略,从原理和工程的角度理解超参数的选择、网络层数设置、数据处理等多种方法的优点和缺点,更进一步的加深对分类网络的细节理解。

2、细粒度图像分类

多类别图像分类网络在类别差异比较大的数据集上,甚至可以取得超过人类的准确率。但是当类别之间的差异非常小(如不同品牌之间的车型往往非常相似),亦或是类内差距非常大的情况下(如桌椅的造型非常之多),其准确度会大打折扣,这就涉及到细粒度图像分类的相关研究。

第二部分我们将深入了解细粒度图像分类的相关研究现状,并结合两个实际数据集,实现细粒度图像分类,并与多类别图像分类进行对比,发现其二者之间的差异,以达到具体问题具体分析的目的。

3、多标签图像分类

不论是多类别还是细粒度图像分类,单张图片中往往只含有一个类别信息,但在实际生活和工程应用中,某张图片中包含着若干个目标,如上图中含有人、狗和树等多个类别信息。如何对多标签图像数据进行划分和训练,则是一个更具有挑战性的问题。专栏第三部分将以Pascal VOC数据集为基准,实现多标签图像分类的数据读取及网络构建。

4、实例级图像分类和无/弱监督图像分类

实例级别的分类是指,对图像中每个类别的子类或个体进行划分,其实质和目标检测中bounding box的分类训练相同。该任务的难点在于,不仅要区分每个类别,还要正确区分每一个个体。

无/弱监督分类则是减少数据标记的参与程度,让网络自动划分不同的类别。由于缺乏或没有标记信息,无/弱监督图像分类仅可以将不同类别的物体进行聚类,但并不能告知其类别到底是什么。例如,一个包含猫和狗图片的数据集,通过无/弱监督分类,可以将其划分成两部分,但具体哪部分是猫,哪部分是狗,则需要人为的进行判别。

上述两个问题是目前图像分类中更具有挑战性且研究相对较难的部分,专栏的第四部分将对这两种图像分类的研究现状和进展进行介绍,为感兴趣的读者提供一定的思路。

5、其他

除了上述四个部分,专栏还将对实际应用过程中可能出现的问题进行汇总,如样本不平衡、无穷负样本等,并结合现有的研究进展,进行相关的方案解读。同样,也会对分类网络的若干应用进行介绍,如网络可视化、参数可视化等,使你在整个学习过程中更好地了解网络,认清神经网络到底在干什么。

3 写在后面的话

俗话说,万事开头难。想到自己进入图像处理和深度学习领域踩过的诸多大坑,一直都想把自己的一些经验和想法与大家进行分享,希望能帮助到更多的初学者避开一些弯路。

在有三的帮助和鼓励下,萌生了开设专栏的念头。才疏学浅,不敢造次。仅仅希望通过专栏的开设,竭尽所能帮助需要帮助的人,也进一步提高自己写作的能力和基础知识的巩固。

最后,送给大家一句最喜欢的话:

“有志者,事竟成,百二秦关终属楚;苦心人,天不负,三千越甲可吞吴”

有三AI夏季划

有三AI夏季划进行中,欢迎了解并加入,系统性成长为中级CV算法工程师。

有三AI知识星球-今日精选

Residual Attention Network

残差网络和注意力机制的结合,Residual Attention Network。

转载文章请后台联系

侵权必究

(0)

相关推荐