ECCV18 Oral | CornerNet目标检测开启预测“边界框”到预测“点对”的新思路

性能超过所有one-stage类型目标检测算法,训练和测试代码均已开源。

本文来自ECCV2018 Oral论文《CornerNet: Detecting Objects as Paired Keypoints》,作者来自美国密歇根大学。

CornerNet,一种新的物体检测方法,本文使用单个卷积神经网络将目标包围框(bounding box)检测转化为一对关键点对(paired keypoints)的检测,这一对关键点对即待检测目标的左上角点(top-left corner)和右下角点(bottom-right corner)。通过将对象检测转化为成对关键点检测,使得不再需要专门设计anchor boxes,而这之前在one-stage类型的检测器中经常要用到。 除了提出新的算法形式外,本文还引入了一种新的池化方法——corner pooling,它可以帮助网络更好地定位corner。 实验表明,CornerNet在MS COCO数据集上达到了42.1% AP,优于所有现有的one-stage类型的检测器。

anchor boxes方法

现有基于卷积神经网络的目标检测器都需要使用anchor boxes,它们是各种大小和长宽比的框,其组成目标包围框的候选集,one-stage 目标检测算法是在图像上放置大量的anchor boxes,然后对每一个anchor box最可能是要检测目标打分,最后通过回归调整坐标。

anchor boxes有两大缺点:

1.通常数量极大,训练时,DSSD算法用了40K个,RetinaNet算法用了100K个,大量的anchor boxes是不与目标区域重合,这造成了极大的正负样本不平衡,也减慢了训练速度。

2.引入了许多超参数和设计选择,包括需要生成多少个box、大小多少、长宽比如何等,再考虑到往往要支持多尺度检测,使得问题更加复杂。

本文给出的解决方案,放弃anchor boxes,直接检测目标的左上角点和右下角点。

CornerNet算法示意图

本文将对象检测看作为一对边界框角点的检测。 卷积网络为所有左上角输出heatmap,为所有右下角输出heatmap,并为每个检测到的角点输出一个嵌入矢量。 属于同一目标的两个角点的嵌入矢量是相似的,通过训练网络判断相似性,找到属于同一目标的两个角点,即检测到了目标。

corner pooling

如上图所示通常目标包围框的左上和右下角点并没有特殊的局部信息可以捕捉,所以本文发明了corner pooling池化方法,可以有效的从目标区域整体捕捉到左上和右下角点的位置信息。

上两图为corner pooling示意图,以top-left corner pooling 举例,对于每一个通道,从一个分离的特征图在水平到最右和垂直到最下两个方向找到最大值,并把这两个值相加,得到corner pooling的输出。

CornerNet网络概览

骨干网使用Hourglass Network,骨干网的后端是两个预测模块,一个用来预测左上角点,一个用来预测右下角点,使用这两个模块的预测结果,将角点成对的分组到不同目标上(分组使用associative embedding方法),即得到了最终的单个或多个目标的检测结果。

实验结果

在MS COCO数据集上进行了实验,CornerNet打败了所有之间的one-stage检测算法,取得了和最好的two-stage检测算法可匹敌的性能。

速度

在Titan X (PASCAL) GPU上检测目标平均推断时间是244ms。

开源代码主页

https://github.com/umich-vl/CornerNet

这篇论文为目标检测开辟了新思路,从检测目标的包围框转到检测目标的一对关键点对,其最大的创新点是corner pooling,idea看起来很简单,但还有很多地方值得探索,期待后续有更加有趣的算法被发明。

(0)

相关推荐

  • ECCV 2018 | CornerNet:目标检测算法新思路

    极市平台是专业的视觉算法开发和分发平台,加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖 ...

  • ECCV 2018 | OR-CNN行人检测:为‘遮挡’而生

    极市平台是专业的视觉算法开发和分发平台,加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖 ...

  • 一位算法工程师从30+场秋招面试中总结出的超强面经——目标检测篇(含答案)

    作者丨灯会 来源丨极市平台 编辑丨极市平台 极市导读 作者灯会为21届中部985研究生,凭借自己整理的面经,去年在腾讯优图暑期实习,七月份将入职百度cv算法工程师.在去年灰飞烟灭的算法求职季中,经过3 ...

  • ECCV 2018 | Bi-box行人检测:‘行人遮挡’为几何?

    极市平台是专业的视觉算法开发和分发平台,加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖 ...

  • CenterNet:目标即点(代码已开源)

    加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总 ...

  • 竞赛冠军方案:2020珠港澳人工智能算法大赛双料冠军解读

    团队介绍 团队来自深圳市威富视界有限公司.中国科学院半导体研究所,队长为宁欣副研究员,成员分别为石园.刘江宽.支金林.王镇.荣倩倩,排名不分先后. 珠港澳人工智能算法赛题介绍 以检测和识别为核心的各项 ...

  • 霸榜 GitHub:又一款神器面世!

    不论你需要通用目标检测.实例分割.旋转框检测,还是行人检测.人脸检测.车辆检测等垂类算法: 不论是精度效果超强,还是超轻量适合在边缘部署的算法: 不论你是学术科研工作者,还是产业开发者: 不论你是刚入 ...

  • FoveaBox,超越Anchor-Based的检测器

    加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总 ...

  • ECCV 2018 | 行人检测全新视角:从人体中轴线标注出发

    极市平台是专业的视觉算法开发和分发平台,加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖 ...

  • DL之Yolo:Yolo算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之Yolo:Yolo算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 相关文章 CV:人工智能之计算机视觉方向的简介(常用数据集+CV职位).传统方法对比CNN类算法.计算机视觉八大 ...

  • 目标检测学习笔记

    这篇是看完吴恩达老师的 deeplearning.ai 课程里目标检测课程的学习笔记,文章的图片主要来自课程. 目录如下: 目标定位 基于滑动窗口的目标检测算法 滑动窗口的卷积实现 Bounding ...

  • 综述:目标检测二十年(2001-2021)

    作者丨派派星 来源丨CVHub 编辑丨极市平台 极市导读 目标检测领域发展至今已有二十余载,本文将对目标检测领域近20年的发展做一次系统性的介绍,并为目标检测构建一个完整的知识体系架构. 引言 目标检 ...

  • 经典论文系列 | 目标检测--CornerNet & 又名 anchor boxes的缺陷

    设置星标可优先看到本公众号的文章 前言: 目标检测的预测框经过了滑动窗口.selective search.RPN.anchor based等一系列生成方法的发展,到18年开始,开始流行anchor ...

  • 【目标检测算法解读】yolo系列算法三

    前言 本文是yolo系列算法文章的第三篇,也是目前为止yolo系列算法的最终篇.从原理上看,yolov3并没有实质性的创新,主要是借鉴了一些时下state-of-the-art模型的优秀思想.本文重点 ...