ACCV2020国际细粒度识别比赛季军方案解读及Tricks汇总

一、大赛介绍及挑战1.1 背景本次比赛,是由南京理工大学、英国爱丁堡大学、南京大学、阿德莱德大学、日本早稻田大学等研究机构主办,极市平台提供技术支持的国际性赛事,数据集总共包含了55w训练数据(120G),10w测试数据,数据均来自于网上,包含大量的动物和植物,总计5000个类别。大赛官网链接:https://www.cvmart.net/race。

5000个类别中某一类别图片示例1.2 挑战经过初步实验和对数据集的可视化,我们发现本次比赛主要存在有以下挑战:55万的训练数据集中存在有大量的噪声数据训练集中存在较多的图片标签错误训练集与测试集不属于同一分布,且存在较大差异训练集各类别图片数量呈长尾分布细粒度挑战,类间差异小基于这些挑战以及经过多轮实验,我们的解决方案如下。 二、解决方案1、数据清洗为解决数据中存在的问题,我们依次分如下四步对数据进行清洗。1.1清洗噪声数据噪声数据是指非动植物的图片,通过查看数据发现,训练集中包含大量如下这种噪声数据。

清洗方案:1)从1万张非三通道图片中人工挑出1000张左右的噪声图片 和 7000张左右正常图片,训练二分类噪声数据识别模型。                         2)使用1中的二分类模型预测全量50万训练数据,挑选出阈值大于0.9的噪声数据。  3)使用2中噪声数据迭代 1、2过程,完成噪声数据清洗。人工检查,清洗后的训练样本中噪声数据占比小于1%。1.2清洗粗粒度标签错误数据本次竞赛5000类别中,仍有较多的属于两个不同细粒度的图片具有相同标签。如下图的人物合影、荒草都和青蛙属于同一标签。

清洗方案:

1)交叉训练,将50万训练集拆成五分,每4分当训练集,一份当测试集,训练5个模型。 2)将训练好的模型分别对各自测试集进行预测,将测试集top5正确的数据归为正例,top5错误的数据归为反例。3)收集正例数据,重新训练模型,对反例数据进行预测,反例数据中top5正确的数据拉回放入训练集。  4)使用不同的优化方案、数据增强反复迭代步骤3直至稳定(没有新的正例数据产出)。5)人工干预:从反例数据中拉回5%-10%左右的数据,人工check,挑选出正例数据放入训练集6)重复3、4步骤。1.3清洗细粒度标签错误数据细粒度类别标签错误数据如下所示,红色箭头标识的图片与其他三张图片不属于同一类别,却具有相同标签。

清洗方案:

1)交叉训练,将清洗粗粒度错误标签后的训练集拆成五分,每4分当训练集,一份当测试集,训练5个模型。2)将训练好的模型分别对各自测试集进行预测,将测试集top1正确的数据归为正例,top1错误的数据归为反例。3)收集正例数据,重新训练模型,对反例数据进行预测,反例数据中top1正确的数据拉回放入训练集4)使用不同的优化方案、数据增强反复迭代步骤3直至稳定(没有新的正例数据产出)。5)人工干预:从反例数据中拉回5%-10%左右的数据,人工check,挑选出正例数据放入训练集6)重复3、4步骤。1.4清除低质量类别在数据集的5000个类别中,人工看了图片数量少于50的类别,剔除其中图片混乱,无法确认此类别的具体标签。

无法确认具体标签的类别 2、数据增强训练集与测试集属于不同分布,为使模型能更好的泛化测试集,以及捕捉局部细节特征区分细粒度类别,我们采用如下数据增强组合:mixcut随机颜色抖动随机方向—镜像翻转;4方向随机旋转随机质量—resize150~190,再放大到380;随机jpeg低质量有损压缩

随机缩放贴图

图片随机网格打乱重组

随机crop3、数据均衡5000个类别的训练数据呈长尾分布,直接训练会使得图片数量少的类别识别精度不高,在比赛中,我们采取的两种解决方案如下:

上采样数据均衡,每类数据采样至不少于最大类别图片数量的三分之一。统计训练数据各类别概率分布,求log后初始化fc层偏置,并在训练过程中不更新fc层偏置。参考论文:Long-tail learning via logit adjustment

4、Backbones在模型选型上,我们没有做较多的尝试,只使用了如下backbones:EfficientNet-b4EfficientNet-b55、优化在模型优化方面,我们使用radam+sgd优化器,以及大的batch size训练(我们在实验中发现,使用大batch size比小batch size收敛更快,测试集精度更高) ,具体参数如下:label smooth 0.2base_lr=0.03radam+sgdcosine  scheduler分布式超大batch size(25*80=2000)训练6、知识蒸馏—Knowledge  Distillation加上知识蒸馏,可以使我们的模型精度提升约1%:50+w训练集加20w测试集 ,纯模型蒸馏,采用KLDivLoss 损失函数50+w训练集,模型蒸馏(KLDivLoss)*0.5 +标签(CrossEntropyLoss)* 0.57、Ensemble通过选取不同版本的数据集,以及以上不同的数据增强、数据均衡、蒸馏方法和模型结构,训练多个模型取多个(8个)模型fc前一层特征,concat在一起训练一个fc层,训练过程中加随机数据增强取多个(4个)模型fc前一层特征,concat在一起训练一个fc层,训练过程的数据处理与预测保持一致取多个(15、9、8、6)模型的softmax,求平均用以上多个ensemble模型结果投票作为最终结果8、Tricks在预测测试集标签时,相比训练,中心crop出更小的尺寸。训练:resize(img_size*1.15)+randomcrop(img_size);测试:resize(img_size*1.35)+centercrop(img_size)根据10万验证集,5000类,每类只有20张图片的先验,提交结果时,根据预测分值排序,每个类别最多只选取top25的预测,平衡后的提交可以提高0.5~1%精度。三、总结a、能work的模块贡献数据清洗~47% → ~58%数据增强+3%-4%数据均衡+0.5%-1%蒸馏+~1%优化(大 batch size)+~1%Tricks+~1.5%b、不能work的尝试自监督训练backbone降点focal loss无提升先分大类,再分小类无提升c、最终提交结果15个单模型 A榜精度15个单模型ensemble A榜精度~62%-65%67.818%d、未完成验证但有初步效果尝试在ensemble实验中,多模型之间特征高度冗余,可以利用1维卷积合并相关冗余特征,突出差异特征的特征占比,再加一个bn增强泛化性。该方案初步实验有效,但由于比赛截止,未进行进一步实验。ensemble特征方式5模型融合精度多模型fc前一层concat后直接5000类别fc预测62%多模型fc前一层concat后接1维卷积(kernel=5,channel缩小一半)+1维bn+5000类别fc预测62.88%团队介绍:

团队成员均来自滴滴出行-安全产品技术部算法团队(DiDi-SSTG),团队成员分别为:王智恒、薛韬略、井海鹏、张明文、张天明

(0)

相关推荐

  • 基于OpencvCV的情绪检测

    重磅干货,第一时间送达 情绪检测或表情分类在深度学习领域中有着广泛的研究.使用相机和一些简单的代码我们就可以对情绪进行实时分类,这也是迈向高级人机交互的一步. 前言 本期我们将首先介绍如何使用Kera ...

  • 解决物体检测中的小目标问题

    重磅干货,第一时间送达 为了提高模型在小物体上的性能,我们建议使用以下技术: 提高图像捕获分辨率 提高模型的输入分辨率 平铺图像 通过扩充生成更多数据 自动学习模型锚 过滤掉多余的类 为什么小目标问题 ...

  • 小目标检测的福音:Stitcher,简单又有效

    向大家推荐一篇今天新出的目标检测相关论文 Stitcher: Feedback-driven Data Provider for Object Detection ,该文发明了一种简单方法改进业界老大 ...

  • 一文让你掌握22个神经网络训练技巧

    作者丨匡吉 来源丨深蓝学院 编辑丨极市平台 极市导读 在神经网络训练过程中,本文给出众多tips可以更加简单方便的加速训练网络.这些tips作为一些启发式建议,让大家更好理解工作任务,并选择合适的技术 ...

  • 在C#下使用TensorFlow.NET训练自己的数据集

    在C#下使用TensorFlow.NET训练自己的数据集 今天,我结合代码来详细介绍如何使用 SciSharp STACK 的 TensorFlow.NET 来训练CNN模型,该模型主要实现 图像的分 ...

  • 猫狗大战分类TensorFlow实战分享

    点击上方"机器学习爱好者社区" 选择"星标"公众号,重磅干货,第一时间送达 Cats vs. Dogs(猫狗大战)是Kaggle大数据竞赛某一年的一道赛题,利用 ...

  • ACCV2020国际细粒度网络图像识别冠军方案解读、经验总结

    作者丨韦嘉,习思 编辑丨极市平台 极市导读 由极市平台作为官方指定赛事平台的ACCV2020国际细粒度网络图像识别大赛已顺利结束.本文是本次大赛的冠军团队对他们解决方案的解读,包含数据清洗.backb ...

  • ACCV2020国际细粒度网络图像识别亚军方案总结

    来源丨极市平台 编辑丨极市平台 极市导读 作者为ACCV2020细粒度图像分类分析竞赛第二名,本文分享了比赛各阶段的准备以及需要注意的要点和经验,分享给大家作为参考. >>加入极市CV技术 ...

  • 冠军方案解读|世界人工智能创新大赛-口罩识别方向

    2020年世界人工智能创新大赛菁英挑战赛已经圆满落幕,获奖名单已于前日公布,我们邀请到了口罩识别赛题的冠军来做竞赛方案解读. 首先感谢比赛方举办这个比赛,Openvino在CPU上的加速效果很明显,非 ...

  • 比赛总结 | JDATA 2019 雪豹识别挑战赛冠军方案

    作者:情书 知乎链接: https://zhuanlan.zhihu.com/p/108812579 本文已由作者授权转载,未经允许,不得二次转载. 这次复盘的其实是去年12月份结束的雪豹识别的比赛, ...

  • IF国际设计大奖比赛获奖作品赏析

    近日,iF设计奖公布了2021年度获奖名单,今年德国iF设计奖是参赛人数最多的一年,收到了来自全球52个国家近万份作品,创iF新高.本届iF金奖仅评出了75个获奖作品,获奖作品不足1%.现在将2021 ...

  • 《圆的面积》学情分析方案解读

    <圆的面积>学情分析方案解读 一.分析目的: 本单元是在学生已经掌握了长方形.正方形.平行四边形.三角形.梯形的面积以及圆的周长推导过程和计算方法的基础上进行学习的,它是学生初步研究曲线图 ...

  • 家庭建设,可学而至——国际家庭日的中国方案

    在国际家庭日前夕,一些研究家庭教育的学者来四部曲公司/阳明教育研究院考察家庭建设实践课题.考察结束后,一位研究者说:我研究教育,过去一直认为,家庭生活和家人之间的关系,是自然而然的事情,不需要像对待工 ...

  • 投标方案解读| 工程总承包EPC项目投标的关键决策点

    一.EPC工程总承包项目投标的工作流程对于EPC工程总承包项目而言,投标工作流程具有自身的特殊性.在投标的每一阶段,总承包商工作的重点内容和应对技巧都有所不同.下面从前期准备.编写标书和完善与递交标书 ...

  • 辽宁:2021年普通高校招生考试和录取工作实施方案解读

    一.关于考试与成绩 1.2021年我省普通高考考试科目有哪些? 答:2021年,我省普通高校招生考试实行"3 1 2"模式,包括统一高考(以下简称高考)语文.数学.外语(含笔试和听 ...