图像标注的基础内容介绍

2024-08-04 10:18:48

作者丨Surya Remanan

来源丨AI公园

编辑丨极市平台

极市导读

本文从五个需要进行标注的计算机视觉任务（物体检测、线/边缘检测、分割、姿态预测、图像分类）给大家介绍图像标注的种类，应用场景，以及各种标注的优缺点。 >>加入极市CV技术交流群，走在计算机视觉的最前沿

介绍

“如果没有数据分析，公司就会变得既盲又聋，就像高速公路上的鹿一样在网络上游荡。”

— Geoffrey Moore

每个数据科学任务都需要数据。具体地说，是输入系统的干净易懂的数据。说到图像，计算机需要看到人类眼睛看到的东西。

例如，人类有识别和分类物体的能力。同样，我们可以使用计算机视觉来解释它接收到的视觉数据。这就是图像标注的作用。

图像标注在计算机视觉中起着至关重要的作用。图像标注的目标是为和任务相关的、特定于任务的标签。这可能包括基于文本的标签(类)，绘制在图像上的标签(即边框)，甚至是像素级的标签。我们将在下面探讨这一系列不同的标注技术。

人工智能需要的人工干预比我们想象的要多。为了准备高精度的训练数据，我们必须对图像进行标注以得到正确的结果。数据注释通常需要较高水平的领域知识，只有来自特定领域的专家才能提供这些知识。

需要标注的计算机视觉任务：

物体检测
线/边缘检测
分割
姿态预测/关键点识别
图像分类

1) 目标检测

进行目标检测的技术主要有两种，即2D和3D包围框。

对于多边形物体，可以使用多边形方法。让我们详细讨论一下。

2D 包围框

在这种方法中，只需要在被检测的物体周围绘制矩形框。它们用于定义对象在图像中的位置。边框可以由矩形左上角的x、y轴坐标和右下角的x、y轴坐标来确定。

优点和缺点：

标注起来快速和容易。
不能提供重要的信息，如物体的方向，这对许多应用来说是至关重要的。
包括不属于物体一部分的背景像素。这可能会影响训练。

3D 包围框或者立方体

类似于2D边框，除了它们还可以显示目标的深度。这种标注是通过将二维图像平面上的边界框向后投影到三维长方体来实现的。它允许系统区分三维空间中的体积和位置等特征。

优点和缺点:

解决了物体方向的问题。
当物体被遮挡，这种标注可以想象包围框的维度，这可能会影响训练。
这种标注也会包括背景像素，可能会影响训练。

多边形

有时，必须标记形状不规则的物体。在这种情况下，使用多边形。注释时只需标记物体的边缘，我们就能得到要检测的物体的完美轮廓。

优点和缺点:

多边形标记的主要优点是它消除了背景像素，并捕获了物体的精确尺寸。
非常耗时，如果物体的形状是复杂的，很难标注。

注：多边形方法也用于物体形状的分割。我们将在下面讨论分割。

数据采集是ML冷启动的问题。但是，即使你有了一个可行的数据集，构建和测试模型也是需要技巧的。

2) 线/边缘检测（线和样条）

在划分边界时，线和样条是有用的。将区分一个区域和另一个区域的像素进行标注。

优点和缺点:

这种方法的优点是，连线上的像素不需要都是连续的。这样在检测有中断的线或部分遮挡的物体是非常有用的。
手动标注图像中的线是非常累人和费时的，特别是图像中有很多的线的时候。
当物体碰巧是对齐的时候，可能会给出误导的结果。

3) 姿态预测 / 关键点识别

在许多计算机视觉应用中，神经网络常常需要识别输入图像中重要的感兴趣的点。我们把这些点称为地标或关键点。在这种应用中，我们希望神经网络输出关键点的坐标(x, y)。

4) 分割

图像分割是将一幅图像分割为多个部分的过程。图像分割通常用于在像素级定位图像中的物体和边界。图像分割方法有很多种。

语义分割: 语义分割是一项机器学习任务，它需要像素级标注，其中图像中的每个像素都被分配给一个类。每个像素都带有语义意义。这主要用于环境背景非常重要的情况。
实例分割: 实例分割是图像分割的一种子类型，它在像素级别上标识图像中每个物体的每个实例。实例分割和语义分割是图像分割的两种粒度级别之一。
全景分割: 全景分割结合了语义分割和实例分割，所有像素都被分配一个类标签，所有目标实例都被唯一地分割。

5) 图像分类

图像分类不同于目标检测。目标检测的目的是识别和定位目标，而图像分类的目的是识别和识别特定的目标类。这个用例的一个常见示例是对猫和狗的图片进行分类。标注者必须为一只狗的图像分配一个类标签“dog”，对猫的图像分配类标签“cat”。

图像标注的用例

在本节中，我们将讨论如何使用图像标注来帮助机器模型执行特定行业的任务：

零售: 2D边框可以用于标注产品的图像，然后机器学习算法可以使用这些图像来预测成本和其他属性。图像分类在这方面也有帮助。
医学：多边形可用于在医用x射线中标记器官，以便将它们输入深度学习模型，以训练x射线中的畸形或缺陷。这是图像标注最重要的应用之一，需要医学专家具有较高的领域知识。
自动驾驶汽车：这是另一个重要的领域，图像标注可以应用。利用语义分割对图像中的每个像素进行标记，使车辆能够感知到道路上的障碍物。这一领域的研究仍在进行中。
情绪检测：这是里程碑，可以用来检测一个人的情绪(高兴，悲伤，或自然)。这可以应用于评估受试者对特定内容的情绪反应。
制造行业：线和样条可用于标注工厂的图像线跟随机器人工作。这可以帮助自动化生产过程，人力劳动可以最小化。

图像标注的一些挑战

时间复杂度：手工标注图像需要很多时间，机器学习需要大量的数据集，需要大量的时间来有效地标注这些基于图像的数据集。
计算复杂度：机器学习需要精确标注的数据来运行模型。如果标注者在给图像做标注的时候，注入任何一种错误，都可能会影响到训练，所有的努力都可能付诸东流。
领域知识：如前所述，图像标注通常需要特定领域的高级领域知识。因此，我们需要知道该标注什么的注解者，以及该领域的专家。

英文原文：https://heartbeat.fritz.ai/data-annotation-fundamentals-part-1-image-annotation-76f89ccf84f2

自动驾驶传感器之摄像头（十一）车载摄像头图像识别主流算法

作者 / 阿宝编辑 / 阿宝出品 / 阿宝1990 前面章节阐述了摄像头内部的工作原理,一系列的图像效果的处理,包括白平衡.畸变校正.色彩还原等一系列图像的处理,如果我们是做一台手机基本上到这里就 ...
Dataset之Cityscapes：Cityscapes数据集的简介、安装、使用方法之详细攻略

Dataset之Cityscapes:Cityscapes数据集的简介.安装.使用方法之详细攻略 Cityscapes数据集的简介 Cityscapes拥有5000张在城市环境中驾驶场景的图像(297 ...
【AI有识境】如何掌握好图像分割算法？值得你看的技术综述

大家好,这是专栏<AI有识境>的第二篇文章,讲述如何掌握好图像分割算法. 进入到有识境界,可以大胆地说自己是一个非常合格的深度学习算法工程师了,能够敏锐地把握自己研究的领域,跟踪前沿和能落 ...
ECCV18 | 如何正确使用样本扩充改进目标检测性能（附Github地址）

在大多数视觉任务中,对图像进行颜色改变或是增加随机噪声等这些通用数据增广操作,都会改进模型预测能力,但如果能利用特定任务的先验知识则往往会获得更大的性能改进.比如在目标检测的任务中,将目标的图像随机复 ...
收藏 | 使用Mask-RCNN在实例分割应用中克服过拟合

干货第一时间送达转载于:作者:Kayo Yin 编译:ronghuaiyang | AI公园导读只使用1349张图像训练Mask-RCNN,有代码. 代码:https://gith ...
通过对比对象掩码建议的无监督语义分割

重磅干货,第一时间送达小白导读论文是学术研究的精华和未来发展的明灯.小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...
SAR图像数据集：BBox-SSDD、RBox-SSDD和PSeg-SSDD

本文和之前的两篇:<SSDD数据集的标准规范>和<SAR图像船舶目标检测数据集SSDD>均来自文献:SAR Ship Detection Dataset (SSDD)-Ofﬁc ...
收藏 | 图像标注的基础内容介绍

人工智能算法与Python大数据致力于提供深度学习.机器学习.人工智能干货文章,为AI人员提供学习路线以及前沿资讯 23篇原创内容公众号点上方人工智能算法与Python大数据获取更多干货在右上 ...
振动试验基础4 试验条件内容介绍之特殊试验2

4.4 特殊试验介绍2 TWR.sinebeat.sineburst.非高斯随机试验. 再介绍几种特殊试验的条件内容. 时域模拟试验(路谱再现(TWR,timewave replication)试验) ...
振动试验基础4 试验条件内容介绍之特殊试验1

4.4 特殊试验介绍1 RSTD.SOS.SOR.ROR介绍几种特殊试验的条件内容.谐振搜索和驻留试验谐振搜索和驻留试验(RSTD)是指先通过正弦扫频试验搜索出试验体的共振频率,然后在共振频率上进行跟 ...
振动试验基础4试验条件内容介绍之冲击试验

4.3 冲击(shock)试验条件内容介绍冲击是指在极其短暂的时间内给产品施加一个高量级的外力脉冲,从而评估其在储存.运输.使用的寿命周期内对冲击环境的适应性和耐受程度.冲击试验有很多种,自由跌 ...
振动试验基础4 试验条件内容介绍之随机试验

4.2 随机(random)振动试验条件内容介绍如上图,随机振动没有周期性,其波形在时间轴上无法数式化表示,一般,振幅的概率密度函数近似符合正态分布(Normal Distribution).假定: ...
振动试验基础4 试验条件内容介绍之正弦试验

本单元主要介绍一些典型的振动与冲击试验条件内容,希望初入者对其有一定的认识,以便在工作中看到试验条件内容时,而不知所云. 典型振动与冲击试验分类 4.1 正弦振动试验条件内容介绍正弦定频(spot) ...
携子同行PMC基础讲座内容介绍及顺序说明

无论你研发多么牛,无论你营销多么猛,最后你都必须把货交给顾客.无论你是交付服务,软件还是实物.只要涉及到交付,都必然涉及到内部运营的供应链体系.而PMC是企业的供应链体系的主导职业,专职负责协调顾客, ...
分析零件图，看懂零件图，64页内容介绍零件图基础知识

看懂零件图在零件设计制造.机器安装.机器的使用和维修及技术革新.技术交流等工作中,常常要看零件图. 看零件图的目的是为了弄清零件图所表达零件的结构形状.尺寸和技术要求,以便指导生产和解决有关的技术问 ...
电路基础，65页内容介绍电路的基本概念和基本定律，值得保存

电路分析基础本篇文章内容是贯穿全电路知识的重要理论基础,要求在学习中给予足够的重视.通过对本文学习,要求理解理想电路元件和电路模型的概念:进一步熟悉电压.电流.电动势和电功率等基本物理量的概念:深刻 ...

图像标注的基础内容介绍

介绍

1) 目标检测

2D 包围框

3D 包围框或者立方体

多边形

2) 线/边缘检测（线和样条）

3) 姿态预测 / 关键点识别

4) 分割

5) 图像分类

图像标注的用例

图像标注的一些挑战

相关推荐