【杂谈】如果你想快速系统掌握计算机视觉大部分领域,学习人脸图像是唯一选择

笔者是从传统图像算法开始进入计算机视觉行业的,那一批人基本上都是从人脸图像和文本图像开始学,而如今很多计算机视觉从业者却从来没有接触过人脸图像相关的算法,或许真的是时代变了吧。

但笔者想说的是,如果你想快速系统地串联计算机视觉领域的知识,人脸图像应该是唯一选择,没有其他类型的图像可以覆盖底层图像特征,目标检测与跟踪,图像分类和检索,图像滤波,图像分割,三维重建,风格迁移等方向,并且能够做到相互融合从而进行工业界落地。如果你还不知道人脸图像能做什么,不如看一看上面的1分钟视频,然后我们接下来细看到底都有些什么。

底层图像特征

或许很多经典的底层图像特征已经PK不过现在的深度学习模型学习到的特征,但是思想是永恒的,在人脸这个领域,有一些特征理解起来非常直观。

特征通常可以分为颜色特征、纹理特征、形状特征,下面我们看看在人脸方向有哪些很经典的东西。

第一个是肤色高斯模型,它是颜色特征。尽管人有白、黄、黑三种肤色,但研究证明,肤色在某些颜色空间上的差异性主要体现在亮度上,在色度上具有较好的聚类表现。因此根据肤色属性所具有的规律和分布情况对肤色建模,便可以将肤色与非肤色区域区分开。肤色高斯模型在早期可以常用人脸检测,现在也常用于辅助一些模型进行人脸区域的快速定位。

第二个是haar特征,它是纹理特征。脸部有一些固有的属性,比如眼睛要比脸颊颜色要深,鼻梁两侧比鼻梁颜色要深,嘴巴比周围颜色要深等。Haar特征通过对相邻图像块进行灰度比较,并使用积分图像进行快速计算,在大名鼎鼎的V-J算法中被使用。如果研究过OpenCV人脸检测算法的,不可能不知道。

第三个是形状特征,基于人脸特征关键点就可以计算出一系列的形状特征,因为人脸关键点是眉毛、眼睛、鼻子、嘴巴、脸部等有语义的特征点,每个人脸都通用却有独特性,对于光照姿态等有很强的不变性。

目标检测与跟踪

目标检测可以说是计算机视觉方向中从业者最多的了,不然也不会出现千篇一律的简历中写着跑过Yolo算法,人脸检测就是目标检测的一个子领域。

尽管通用的目标检测算法可以用于人脸检测,但是人脸检测依然有它的特点,比如早期的时候一些方法会挨个检测人脸的各个部位,然后组合成最终人脸。以MTCNN为代表的框架会把人脸检测和关键点检测问题进行联合处理。

而如今,在目标检测领域中的一些难题在人脸检测领域同样广泛存在,比如大姿态人脸、遮挡人脸、模糊小脸,甚至是伪造人脸,搞明白了人脸检测,目标检测还会是问题吗?

另一方面,工业界应用的时候不仅要做检测,还需要做跟踪平滑,此时常常需要应用卡尔曼滤波等传统算法,而不仅仅是一个模型就能搞定,更复杂完整的项目,才能更好地锻炼能力。

图像分类和检索

没有人不知道图像分类问题,而为我们所熟悉的人脸识别系统,其中一条典型的技术路线就是图像分类+验证+检索模型的组合

以上图DeepFace为例,它首先对输入人脸经过3D对齐,然后使用数据集训练一个人脸分类器得到人脸特征提取网络,最后使用Siamese网络训练人脸验证网络。这样一来,就解决了人脸特征的问题,即将高维的人脸表达成了一个低维的特征,接下来就是进行人脸的聚类与检索。

如今人脸识别系统虽然已经大规模商业化,但并不意味着这里面就没有事情可以做了。遮挡人脸识别,跨姿态人脸识别,跨年龄人脸识别,妆造不变人脸识别,光照不变人脸识别,少样本人脸识别,3D人脸识别,视频人脸识别等都是现实存在的难题。

解决上面这些问题,不仅需要新的技术,也需要对分类检索等老技术的改进。

图像滤波

图像滤波是一类很底层的图像处理方法,在图像降噪,图像去模糊,图像修复等底层图像处理领域中是核心技术。那么在人脸图像中,又用在了哪里呢?大家或许不知道技术,但是不可能没有接触过,那就是人像美颜,熟的不能在熟的磨皮美白大法。

其中常见的方法包括均值滤波,双边滤波,引导滤波,以及针对这些方法的改进。掌握了核心技术,从人脸美颜迁移到其他的图像增强领域,就很自然了。

三维重建

三维重建即3D Reconstruction,在计算机视觉中,三维重建是指根据单视图或者多视图的图像重建三维信息的过程,通常需要从二维的图像投影恢复出物体的三维形状和纹理信息,这是接下来计算机视觉会取得突破的重点领域,而人脸的三维重建问题,实在是太典型了。

从基于单张图的3DMM等人脸通用模型与Shape from Shading(SfS)等优化方法,到基于多张图的立体视觉,基于视频的Structure from Motion(SfM),端到端的与端到端的模型,传统的与深度学习方法,这个领域涉及的算法非常多,而且难度较高。

另外,如何逼真地重建出人脸的细节信息,如何在二维的人脸被遮挡后还能进行重建,都是当前人脸重建领域要解决的难题,研究起来有足够的技术深度,一旦攻克也有大量商用场景。

另外3D与图形学有非常紧密的联系,使得这些技术在内容创作上有非常大的商业价值,难道你不想加入其中吗?

图像编辑与风格化

随着生成对抗网络等技术的发展,当前图像编辑与风格化正在成为计算机视觉领域的新热点,其中尤其是人脸图像落地能力最强,在人机交互,娱乐社交,内容创作等领域应用非常广泛。

从人脸年龄编辑、人脸卡通头像生成、换脸等全局性质的编辑,到人脸表情编辑,人脸发型,人脸化妆去妆等局部性质等编辑,几乎覆盖了图像编辑与风格化的所有关键技术。当前交互式,可控的编辑模型也是研究重点。

怎么规划学习路线

上面说了这么多,无非就是想告诉大家,作为打算长期在计算机视觉有所建树的同学,人脸图像是非常值得研究的,也是不可能绕过的,那么如何长期学习相关知识呢?下面介绍我们的两个内容。

(1) 2020年7月,有三的新书《深度学习之人脸图像处理:核心算法与案例实践》在机械工业出版社出版,这是一本讲述在人脸各个方向中的深度学习算法的书籍,同时配套有大量实战案例。

言有三新书来袭,业界首次深入全面讲解深度学习人脸图像算法

书中各章节内容如下:

第1章 人脸图像和特征基础

第2章 深度学习基础

第3章 人脸数据集

第4章 人脸检测

第5章 人脸关键点检测

第6章 人脸识别

第7章 人脸属性识别

第8章 人脸属性分割

第9章 人脸美颜和美妆

第10章 人脸三维重建

第11章 人脸属性编辑

这是市面上唯一一本将人脸各领域这几年的核心算法讲清楚的书,而且在可预见的几年内都可能如此。

(2) 有三AI秋季划人脸算法组和GAN组,这是集教材,图文代码实践,视频课程和直播,知识星球社区,线上微信群,线下活动为一体的终身有效学习小组,详细可以阅读以下文章。

【通知】如何让你的2020年秋招CV项目经历更加硬核,可深入学习有三秋季划4大领域32个方向

最后总结一句,人脸图像算法领域,技术成熟,又有许多需要长期研究的内容,学习它,难道不香吗?

(0)

相关推荐