PANDA行人和车辆多目标检测方案及baseline代码

赛题背景
PANDA(gigaPixel-level humAN centric video Dataset)是清华大学团队构建的国际上首个动态大场景多对象数据平台,场景平均覆盖平方千米级范围,可同时观测数千人,百米外人脸清晰可识别,视频帧分辨率近10亿像素。
给定静态PANDA图像,参赛者需要检测两种类型的对象:行人和车辆。对于每个行人,需要提交三种检测结果框:可见范围位置框、全身范围位置框、头部范围位置框。对于每辆车,需要提交一个可见范围位置框。

在评价结果时,会忽略一些特殊情况(如反射或阴影区域、人与车极为拥挤的区域、严重遮挡区域)。

更多介绍:

50万奖金,10亿像素,这个目标检测与跟踪可不简单

报名链接:

https://tianchi.aliyun.com/s/be6691073b92dc4f2c2f230db97af7f5

计入评测的四个类别

类别ID

类别

1

人可见部分(visible body)

2

全身(full body)

3

人头(head)

4

车辆可见部分(visible car)

注:"small car" 、 "midsize car" 、 "large car" 、 "bicycle" 、 "motorcycle" 、 "tricycle" 、 "electric car" 、 "baby carriage" 8类统一合并为visible car类别。

未计入评测(可忽略)的类别

类别属性

类别

fake person、ignore、crowd

vehicles、unsure

赛题与数据分析
该赛题属于典型的目标检测问题,但由于原图分辨率近10亿,直接训练是不可取的。因为当下主流机器的显存根本不支持该大小原图训练,若对原图缩放,则本来属于大目标的物体(area>96*96),也可能变成小目标,甚至丢失像素信息,而原本的小目标更将不复存在。

PANDA-Image由555张静态十亿像素图片组成,总共包含21个不同的场景。赛题组提供390张图片用于训练,训练数据分布在其中的13个场景。统计类别宽高分布和数量直方图如下:

图1. 类别宽高分布
图2. 类别数量统计
可以得出结论:虽然类别种类较少,图片数量不多,但每张图上的目标数量非常密集,单图最多包含2098个目标。并且由于场景平均覆盖平方千米级范围,类内的尺度分布跨度大,类间的尺度分布也差异明显。
进一步对训练数据统计分析

类别ID

最大尺度

最小尺度

1

(1648.31, 6518.8)

(7.64, 13.57)

2

(3926.57, 5068.1)

(6.94, 28.94)

3

(1396.35, 989.95)

(3.64, 3.45)

4

(11541.06, 5068.63)

(3.3, 1.65)

类别ID

小、中、大目标数(32*32,96*96界定)

1

[796, 17319, 64414]

2

[274, 12933, 69322]

3

[26241, 43908, 12380]

4

[166, 2454, 17441]

通过上述两表可知,类别1,2,4集中在中大目标,类别3则大中小目标分布相对均匀。每个类别最小与最大尺度跨度惊人。
基于mmdetection的解决方案
1)选取目标检测模型。这里选用cascade rcnn r50作为base模型,加入FPN和DCN增强对目标尺度变化的感知。
2)训练。原图近十亿像素,直接训练是不可取的,故需要对原图进行裁剪。裁剪分为离线裁剪和在线裁剪两种方式,笔者均有尝试。
i. 离线裁剪。对原图按指定宽高,步长的窗口从左向右,自上而下依次滑动切片,overlap一般控制在0.1-0.5之间。切片过程中有些目标GT会被窗口切分,计算目标与窗口的iof,保留大于0.5iof的目标GT,并将GT限定在窗口内。
ii. 在线裁剪。在训练时读取图片resize前进行该操作:选取当前图片中任意目标GT,在其GT附近随机位置选取指定大小窗口(包含选取目标GT)进行裁剪。
同样地,若窗口切分到其他目标,保留大于0.5iof的目标GT,并限定在窗口内。若当前选取目标大于指定窗口大小,则将该目标裁剪限定在该窗口大小内。
3)测试。测试时将原图以训练时指定大小,步长的窗口滑动切片,对切片进行预测,映射回原图时,使用NMS对重叠区域的目标重复预测情况进行抑制。
baseline代码(score47,AP42,排名Top20):
https://tianchi.aliyun.com/forum/postDetail?postId=190555
总结与展望
1)本次赛制存在一定难度,笔者认为主办方希望模型在保证精度和新场景泛化性的基础上,又严格控制单张图片预测的时间,故参赛选手需要在精度和速度上做一个权衡。
2)离线裁剪与在线裁剪均有效,但在线裁剪更为便捷和轻巧。
3)裁剪窗口大小需要根据类别大小分布进行合理选择并不断尝试。
4)从速度上考虑应该是使用多个指定大小窗口进行裁剪并多尺度统一训练,从精度上考虑应该是每个类别根据自身尺度变化范围单独训练专家模型。
5)评价指标是AP(0.5:0.05:0.95),说明对边框回归的精准性要求更高。可尝试与IoU相关Loss或其他边框坐标注意力机制。
6)数据不够干净,边框标注存在歧义,少数类别标错,故可对数据标签进行清洗。
我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

在看,让更多人看到

(0)

相关推荐

  • 【计算摄影】计算机如何学会自动裁剪图片(自动构图)?

    大家好,这是专栏<计算摄影>的第三篇文章,这一个专栏来自于计算机科学与摄影艺术的交叉学科.今天我们讨论的问题是图像的自动裁剪/自动构图问题. 作者&编辑 | 言有三 1 自动构图基 ...

  • 超快速的端到端实例分割模型,手把手教你用opencv部署Yolact

    作者丨nihate 审稿丨邓富城 编辑丨极市平台 极市导读 作为ncnn推理框架里唯一一款做实例分割的模型,yolact也展现出了它的魅力,实现端到端一阶段完成实例分割且运行速度快.本文为作者上手编写 ...

  • 图像处理之目标检测入门总结

    重磅干货,第一时间送达 本文首先介绍目标检测的任务,然后介绍主流的目标检测算法或框架,重点为Faster R-CNN,SSD,YOLO三个检测框架.本文内容主要整理自网络博客,用于普及性了解.ps:由 ...

  • 【2021摄影交流-064】后期修图:图片裁剪

    裁剪是后期修图使用很频繁的功能,裁剪做起来是一个很简单的动作,但是要做好并不容易. 我们知道裁剪功能,更要知道自己的图片为什么要裁剪,最终要裁剪成什么样子.不是为了裁剪而裁剪,也不能没有目的胡乱裁剪, ...

  • CVPR2019| 04-08更新19篇论文及代码(1篇oral、目标检测、行人检测、视频超分辨等)

    前段时间,计算机视觉顶会CVPR 2019 公布了接收结果,极市也对此做了相关报道:1300篇!CVPR2019接收结果公布,你中了吗?.目前官方只公布了接收论文ID列表,极市已汇总目前公开的所有论文 ...

  • 使用Python OpenCV yolov5实现行人目标检测

    来源:深度学习与计算机视觉 编辑:王萌(深度学习冲鸭公众号) 著作权归作者所有,本文仅作学术分享,若侵权,请联系后台删文处理 后台回复西瓜手推获得西瓜书手推笔记 后台回复CV入坑必备获得CV入坑学习资 ...

  • 工业视觉中的目标检测——兼谈天池大赛优胜方案

    目标检测是计算机视觉领域研究最火热的方向,这从计算机视觉顶会CVPR相关论文数量就能看得出来. 目标检测应用范围广泛,上至卫星遥感,下至自动驾驶,大到鲸鱼保护,小到生物细胞分析,都有其用武之地. 我们 ...

  • 一种对空红外弱小目标检测跟踪方法研究

    0 引言 现代战争中,以小型无人机.电视侦察弹等为代表的战场侦查设备层出不穷,对地面部队和武器装备的生存能力形成较大威胁,为此,有效发现.跟踪和打击该类目标成为必然的战场军事需求.其中目标检测与跟踪技 ...

  • 低信噪比下的红外弱小目标检测算法研究综述

    低信噪比下的红外弱小目标检测算法研究综述

  • 一种近地背景下红外弱小目标检测预处理算法

    0 引言 红外弱小目标检测技术作为红外探测系统的关键技术之一,其算法的有效性直接影响着红外设备的探测性能,因此,红外弱小目标检测算法始终是红外探测领域的研究热点之一[1-2]. 多年来,红外弱小目标检 ...

  • 基于杂波抑制的海平线红外弱小目标检测

    基于杂波抑制的海平线红外弱小目标检测 基于杂波抑制的海平线红外弱小目标检测 杨会玲1,3*,吴玉宏2,孙慧婷1,杜博军2,何 昕3 (1.苏州科技大学 苏州市虚拟现实智能交互应用技术重点实验室,江苏 ...

  • 基于LBP的红外弱小目标检测系统设计

    蒋怡亮,孙宁,翟尚礼 (中国电子科技集团公司 第二十八研究所,南京 210007) 摘要:分析了一种基于局部二元模式(LBP)算子的红外弱小目标检测方法,并根据实际应用背景设计实现了一种红外弱小目标检 ...

  • 多伯努利滤波的快速红外弱小目标检测与跟踪

    李翠芸,李 宁,姬红兵 (西安电子科技大学电子工程学院,陕西西安 710071) 摘要:针对复杂背景下多个弱目标检测与跟踪中存在的跟踪不稳定.非实时及量测模型高度非线性问题,提出一种基于多伯努利滤波的 ...