理解物体检测中的Objectness

作者:Nathan Zhao

编译:ronghuaiyang

导读

在本文中,我们将讨论目标检测模型和Objectness的基础知识。

什么是物体检测模型?

物体检测模型本质上,正如其名称所示,检测物体。这意味着给定一个图像,它可以告诉你物体在哪里,以及这个物体是什么。例如,在上面的图像中,我们有许多物体,并且使用物体检测模型,我们已经检测出不同的物体在图像中的位置。

这类模型有很多应用。举几个例子,物体检测在以下方面很有用:

  • 自动驾驶汽车,可以检测到乘客、其他车辆、红绿灯和停车标志。
  • 安保,模型可以探测到公共区域的枪支或炸弹,并向附近的警察报警。

总的来说,这类模型非常有用,在过去几年里,机器学习社区已经对它们进行了大量的研究。

物体检测中区域建议的介绍

首先,让我们了解一下物体检测模型是如何工作的。首先,我们必须给出一个物体的建议位置。我们把这个建议的位置称为我们感兴趣的区域,通常显示在一个边界框(也称为图像窗口)中。根据物体检测模型的类型,我们可以通过许多不同的方式来实现这一点。

  • 朴素方法:我们将图像分割成多个部分,并对每个部分进行分类。这种方法效率低下是因为必须对每个生成的窗口应用分类网络(CNN),导致计算时间长。
  • 滑动窗口方法:我们预先确定好窗口比例(或“锚”),然后滑过图像。对于每个窗口,我们处理它并继续滑动。与朴素方法类似,这种方法生成的窗口较多,处理时间也比较长。
  • 选择性搜索:使用颜色相似度,纹理相似度,和一些其他的图像细节,我们可以用算法将图像分割成区域。虽然选择性搜索算法本身是耗时的,但这使得分类网络的应用需求较少。
  • 区域建议网络:我们创建一个单独的网络来确定图像中感兴趣的区域。这使得我们的模型工作得更快,但也使得我们最终模型的准确性依赖于多个网络。

上面列出的这些不同选项之间有一些区别,但一般来说,当我们加快网络的处理时间时,我们往往会牺牲模型的准确性。

区域建议机制的主要问题是,如果建议的区域不包含物体,那么你的分类网络也会去分类这个区域,并给出一个错误的标记。

那么,什么是Objectness?

Objectness本质上是物体存在于感兴趣区域内的概率的度量。如果我们Objectness很高,这意味着图像窗口可能包含一个物体。这允许我们快速地删除不包含任何物体的图像窗口。

如果一幅图像具有较高的Objectness,我们期望它具有:

  • 在整个图像中具有唯一性
  • 物体周围有严格的边界
  • 与周围环境的外观不同

例如,在上面的图像中,我们期望红色框具有较低的Objectness,蓝色框具有中等的Objectness,绿色框具有较高的Objectness。这是因为绿色的框“紧密”地围绕着我们的物体,而蓝色的框则很松散,而红色的框根本不包含任何物体。

我们如何度量Objectness?

有大量的参数影响图像窗口的objectness。

  • 多尺度显著性:这本质上是对图像窗口的外观独特性的度量。与整个图像相比,框中唯一性像素的密度越高,该值就越高。
  • 颜色对比度:框内像素与建议图像窗口周围区域的颜色对比度越大,该值越大。
  • 边缘密度:我们定义边缘为物体的边界,这个值是图像窗口边界附近的边缘的度量值。一个有趣的算法可以找到这些边缘:https://cv-tricks.com/opencv-dnn/edge-detection-hed/。
  • 超像素跨越:我们定义超像素是几乎相同颜色的像素团。如果该值很高,则框内的所有超像素只包含在其边界内。

超像素区域以不同颜色显示。请注意,框内的超像素大部分不会泄漏到图像窗口之外。因此,这个“超素跨界”值将会很高。

以上参数值越高,objectness越高。试着将上述参数与我们前面列出的具有高objectness的图像的期望联系起来。

英文原文:https://medium.com/@zhao.nathan/understanding-objectness-in-object-detection-models-5d8c9d032488

(0)

相关推荐

  • 收藏 | 使用Mask-RCNN在实例分割应用中克服过拟合

    干货第一时间送达 转载于:作者:Kayo Yin 编译:ronghuaiyang     |    AI公园 导读 只使用1349张图像训练Mask-RCNN,有代码. 代码:https://gith ...

  • 【博文连载】边缘检测算法介绍

    所谓边缘是指其周围像素灰度急剧变化的那些象素的集合,它是图像最基本的特征.边缘存在于目标.背景和区域之间,所以,它是图像分割所依赖的最重要的依据.由于边缘是位置的标志,对灰度的变化不敏感,,因此,边缘 ...

  • 图像分割

    什么是图像分割? (1)图像分割的主要目标是将图像划分为与其中含有真实世界的物体或区域有强相关性的组成部分 (2)分割方法可以归类如下:阈值化.基于边缘.基于区域 (3)每个区域可以用其封闭的边界来表 ...

  • 对象检测和图像分割有什么区别?

    重磅干货,第一时间送达 01.人工智能中的图像预处理 对象检测和图像分割是计算机视觉的两种方法,这两种处理手段在人工智能领域内相当常见,本文将介绍对象检测和图像分割之间的区别. 在这两个任务中,我们都 ...

  • Mask R

    原文链接 Mask R-CNN Keras 对象检测 对象分割 像素掩码 在 2019年7月16日 上张贴 由 hotdog发表 Mask R-CNN Keras 在本教程中,您将学习如何使用 Ker ...

  • 实战:基于深度学习和几何的3D边界框估计

    重磅干货,第一时间送达 3D 对象检测问题在需要决策或与现实世界中的对象交互的机器人应用中尤为重要,3D 对象检测从图像中恢复对象的 6 DoF 姿态和尺寸.虽然最近开发的 2D 检测算法能够处理视点 ...

  • 计算机视觉物体检测中面对的挑战

    导读 给出了目前目标检测中的一些问题和挑战. 几年前,在图像中寻找并分类单个物体是一项极其困难的任务.今天,在计算机视觉的帮助下,数字设备可以简单快速地识别图像的内容,这为不同领域的视觉数据理解和分析 ...

  • 物体检测中的小物体问题

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 推荐阅读 42个pycharm使用技巧,瞬间从黑铁变王者 Goog ...

  • 在物体检测中搞定小目标

    作者:Jacob Solawetz 编译:ronghuaiyang 导读 在计算机视觉中,检测小目标是最有挑战的问题之一.本文给出了一些有效的策略. 从无人机上看到的小目标 为了提高你的模型在小目标上 ...

  • 解决物体检测中的小目标问题

    重磅干货,第一时间送达 为了提高模型在小物体上的性能,我们建议使用以下技术: 提高图像捕获分辨率 提高模型的输入分辨率 平铺图像 通过扩充生成更多数据 自动学习模型锚 过滤掉多余的类 为什么小目标问题 ...

  • 数学漫步第4章:如何理解四维空间中的物体?

    文章转自dimensions-math.org,[遇见]有修改补充,转载请注明. 瑞士数学家路德维希·施莱夫利(1814-1895)介绍了存在于四维空间中的物体,让我们见识到了一系列奇形怪状的四维正多 ...

  • 遥感图像中的小物体检测(内有新数据集)

    干货第一时间送达 文章:Small-Object Detection in Remote Sensing Images with End-to-End Edge-Enhanced GAN and Ob ...

  • 干货|在目标检测中如何解决小目标的问题?

    作者丨Nabil MADALI 来源丨AI公园 编辑丨极市平台 极市导读 在深度学习目标检测中,特别是人脸检测中,由于分辨率低.图像模糊.信息少.噪声多,小目标和小人脸的检测一直是一个实用和常见的难点 ...

  • 如何理解波浪理论中的推动浪和修正浪?

    波浪理论是一套非常成熟的价格预测体系,它将价格的波动分为推动浪和修正浪,如果能够判断当前市场所处的位置,那么波浪理论就能够帮助我们找出一些高胜率的交易机会,做出更好的交易决策. 在今天的文章里,我们将 ...

  • 如何理解书法草书中的“一点二连三交代,四墨五紧六飞白”这句话?

    "一点二连三交代,四墨五紧六飞白."不知出处是何处,应该是草书者的经验及感悟,有一定道理,因此笔者愿与题主即各位同道朋友作一些探讨. 我们知道,笔法.字法.章法构成了书法的三要素, ...