【知识星球】这几年人脸都有哪些有意思的数据集?
有三AI知识星球-数据集
MeGlass
MeGlass是一个仿真的带眼镜的人脸识别数据集,包括1710个人的14 832张有眼镜图和33087张无眼镜图,各自至少有两张。
作者/编辑 言有三
眼镜对人脸识别问题会造成一定的困扰,MeGlass是一个仿真的戴眼镜人脸识别数据集,包括1710个人的14 832张有眼镜图和33087张无眼镜图,所有的图片来自于MegaFace。
统计信息如下:
一些图片案例如下:
参考文献
[1] Guo J, Zhu X, Lei Z, et al. Face synthesis for eyeglass-robust face recognition[C]//Chinese Conference on Biometric Recognition. Springer, Cham, 2018: 275-284.
有三AI知识星球-数据集
Makeup Transfer
Makeup Transfer是一个妆造迁移人脸数据集,有3384张女性人脸图。
作者/编辑 言有三
Makeup Transfer包括3834张女性人脸图,其中1115张无妆造人脸,2719张有妆造人脸。妆造类型包括不同程度的烟熏妆(smoky-eyes makeup style), 华丽妆(flashy makeup style),复古妆(Retro makeup style),韩式妆(Korean makeup style)以及日式妆(Japanese makeup style)。
参考文献
[1] Li T, Qian R, Dong C, et al. Beautygan: Instance-level facial makeup transfer with deep generative adversarial network[C]//Proceedings of the 26th ACM international conference on Multimedia. 2018: 645-653.
有三AI知识星球-数据集
DFW
DFW(Disguised Faces in the Wild)是一个妆造和伪造人脸数据集,有1000个人的11157张图。
作者/编辑 言有三
DFW是IBM发布的一个妆造人脸数据集,有1000人的11157 张图片,主要包括遮挡和伪造人脸。每一个人都有一张正脸图,其中903张人有一个验证图,两者构成正常的人脸验证对。所有1000个人都有一些包括妆造图,874个人有一些被识别成该人(故意的或者非故意的)的伪造图,最终总共1000张整成图, 903张验证图,4814张妆造图, 4440张伪造(另一个人)图。
上图是一些样本,第一张是正常图,黄色底色是验证图,绿色底色是妆造图,蓝色底色是伪造(另一个人)图。
参考文献
[1] Kushwaha V, Singh M, Singh R, et al. Disguised faces in the wild[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops. 2018: 1-9.
有三AI知识星球-数据集
Cartoonset10k/100k
Cartoonset10k/100k是一个漫画人脸数据集,包括100000张具有不同艺术风格的人脸头像,可以用于人脸风格化等应用。
作者/编辑 言有三
CartoonSet10k和CartoonSet100k,分别包含10000和100000张卡通人脸图。每一张卡通人脸图都有16个组件,其中12个面部属性和4个颜色属性。
下面是它的样本和属性标注,其中csv内容每一行是名字,属性index,以及该属性的种类。
参考文献
[1] Royer A, Bousmalis K, Gouws S, et al. Xgan: Unsupervised image-to-image translation for many-to-many mappings[M]//Domain Adaptation for Visual Understanding. Springer, Cham, 2020: 33-49.
有三AI知识星球-数据集
FairFace
由于当前很多的人脸数据集中存在人种的不均衡,比如白人居多黑人居少,fairface建立了一个更加均衡的数据集。
作者/编辑 言有三
目前很多开源数据集中人种比例非常不平衡,下面是一个统计。
针对这个现象,FairFace数据集被整理出来,它是一个人脸属性数据集,共包括white,black,Indian,East Asian,Southeast Asian,Middle East以及Latino7类人种,图片来源于YFCC-100M Flickr数据集,标注属性包括人种(race),性别(gender),年龄组(age group)。
数据集共有108501张图,和其他数据集对比一览如下:
参考文献
[1] Kärkkäinen K, Joo J. FairFace: Face Attribute Dataset for Balanced Race, Gender, and Age[J]. arXiv preprint arXiv:1908.04913, 2019.
除了上面这些,我们还分享了数十个各种各样的大型小型人脸数据集,下面是其中一些预览案例,供感兴趣的你获取,所有数据集在星球中提供下载,经常会更新!
6 关于数据集
有三AI知识星球是我们继公众号之后重点打造的原创知识学习社区,其中数据集板块专注于给大家介绍重要数据集和新奇好玩的数据集,包括
(1) 经典大型数据集,ImageNet,CityScape,AffectNet,AVA等。
(2) 各类新奇好玩的数据集,等你来发掘啦。
超过1T的资源,还可以进行数据集求助!希望你喜欢。