【隐创128期】军事目标显著性与可识别性的研究(二)
编者按:
现代研究认为,目标的显著性与可识别性可以作为两种有效的军事手段进行应用。目标的显著性在作战中被定义为目标能够吸引视觉注意力的视野中心周围的区域,视觉显著性能够预测人类在与军事相关的复杂场景中的视觉搜索性能。视觉显著性可用于在现场(复杂环境中)或实验室中简单、快速地测量,这消除了对昂贵且耗时的视觉搜索实验的需要。现场测量和实验室测量之间的一致性意味着显著性可以用来验证合成图像。
目标的可识别性在作战中被定义为将目标特性减少至其识别阈值所需的高斯模糊量。这是一个有效的度量标准,可以用来深入了解人类的识别性能,而不必求助于复杂和昂贵的实验。可识别性与PID性能直接相关,因此非常适合于比较合成图像和真实图像。研究团队的结论是,通过将目标的显著性和可识别性设置为与现实世界中的目标相同,可以为人类视觉搜索和检测任务校准合成图像。
关键词:可识别性,显著性,模拟,验证,人类感知,合成图像
3.1正式介绍
当目标的细节清晰可见时,就更容易识别。因此,捕捉目标视觉清晰度的度量应该与人类视觉识别性能相关联。这表明在复杂背景中目标的可识别性可以通过量化目标的视觉清晰度来确定。研究人员将目标可识别性定义为将目标特征降低到其识别阈值所需的高斯模糊量。选择低通特征降级滤波器的理由是,所有空间频率都有助于目标识别高斯模糊过程易于实现。可以应用简单的调整过程来快速确定高斯滤波器的阈值范围。这使得目标可识别性度量对于复杂的识别实验来说是一个有吸引力的选择。
在接下来的部分中,研究人员将描述一个实验,该实验旨在验证新的目标可识别性度量。这个实验的结果将表明,可识别性确实决定了识别性能,因此它为测量识别分数提供了一种有效的替代方法。
3.2验证实验
Jacobs等人最近进行了一项实验,他们在名义上相同的真实和合成热图像集上比较了识别性能。获得了代表概念上的第一代和高级扫描传感器系统的真实图像。从传感器数据中获得的参数用于生成合成图像,这两个图像集被用于训练有素的人类观察者的目标识别实验。这些图像的一个例子如图5所示。关于图像配准和生成过程的详细信息,我们参考Jacobs等人的研究。在这项研究中,我们使用他们的图像子集和相应的识别数据来验证我们的新的可识别性度量。
3.3实验内容
两名观察员参加了实验,实验在由Matlab软件控制的PC机上进行。这些图像显示在22英寸的电脑显示器上(分辨率为1280x1024)。观察者坐在离电脑显示器一定距离(约50cm)的地方,可以自由调整他/她与屏幕的距离(实验是在光线昏暗的房间里进行的)。
图 5 第一代前视红外(左:a和b)和高级扫描前视红外(右:c和d)的参考图像(a和c)和合成(未校正)版本(b和d)示例
3.3.1试验数据
参考图像集代表5种不同的军用车辆(2S3;BMP-1;T-62;T-72;ZSU)在自然地形背景中,在5个不同的观看距离处显示的结果(并且针对两个不同的方位)。这50幅参考图像是用先进的扫描LWIR传感器采集的。第二组50个参考图像是通过将原始50个参考图像降级以模拟第一代传感器而生成的。产生的100幅参考图像也使用模拟程序的两种不同参数设置模拟了两次。在他们的验证实验中,Jacobs等人发现最初用于生成合成图像的参数集不是完整的,并且需要额外的参数。因此,他们生成了另一组经过校正的合成图像。在本文的其余部分,我们将原始的和校正的合成图像集称为“合成”和“校正后的合成”图像。因此,整个图像集由100个名义上相同的参考、合成和校正合成热图像的三部分组组成。
3.3.2试验程序
在参加测试之前,每个观察者都使用作战车辆识别(ROC-V)训练软件接受了目标识别训练。ROC-V是由CECOM NVESD开发的基于窗口的热视训练程序。它通过使用交互式课程帮助士兵学习识别作战车辆的热特征,该课程教授车辆“热点”和整体车辆形状的独特模式和形状。
在每次试验开始时,从测试集中随机选择一幅图像,观察者必须指出显示的车辆类型。在观察者通过按下键盘上适当的响应按钮来识别目标之后,通过在屏幕上显示实际车辆类型的名称来给出书面反馈。按下第二个按钮后,名称消失,观察者开始实际的可识别性测量程序。这个过程包括调整高斯模糊核的宽度,通过按键盘上的上下箭头键,观察者可以增加或减少显示图像的模糊量。模糊量可以以15%或3.5%的步长改变(用于微调。在一个典型的测量中,观察者最初增加模糊的量,直到他不能再识别目标。然后,他减少模糊,直到他确信他可以再次识别目标。重复这种模糊和去模糊的过程,直到受试者确信他已经达到阈值。
图 6 原始图像示例(左)及其模糊版本(右)。观察者的任务是将模糊量设置为一个可以识别车辆的值。这个阈值被称为可识别性度量
在观察者不能识别未模糊图像的情况下,阈值被设置为0.76像素的值,对应于低于1像素模糊的2级。通过人为地固定该值,我们确保对应于给定距离的所有图像的平均值趋向于低值,即平均值受无法识别的图像数量的影响。我们获得了300幅图像中每幅图像的可识别性度量。实验分8次进行,持续约7分钟。
3.4试验结果
验证实验的结果如图7所示。图7a再现了Jacobs等人的结果。该图显示了正确识别的目标的比例与观看距离的函数关系。将真实图像的结果与原始合成图像的结果以及参数设置已被校正的合成图像的结果进行比较,以使这些图像的比例积分微分性能与真实图像的比例积分微分性能相匹配。结果清楚地表明,原始合成图像的比例积分微分比真实图像的比例积分微分高得多。校正后,合成图像的PID性能与真实图像的PID性能相匹配。
图 7 (a)对于第一代前视红外系统,Jacobs等人测量的比例积分微分是距离的函数。这些曲线分别对应于真实图像(“参考”、实心圆)、合成(实心正方形)和校正合成(空心正方形)图像。相同图像的像素可识别性(模糊阈值),其中两个观察者的判断是平均的
图7b示出了相同图像的以像素表示的可识别性(两个观察者的平均值)。结果显示了与PID性能结果相似的模式。在这两种情况下,对应于原始合成数据的阈值高于参考数据,但是校正的合成数据与参考数据匹配。
图8显示了PID(由Jacobs等人测量)和可识别性(以像素为单位)之间的关系。数据用对数线拟合。PID与可辨识性之间的相关性较高,平均相关系数为0.91(单个观测者的相关系数分别为:观测者MH为0.92,观测者PB为0.89)。
图 8 可识别性测量值是在相同观察距离下记录的所有图像的平均值(传感器类型、车辆类型和方向的平均值)。所画的线代表数据的对数拟合
图 9 两个观察者(MH和PB)的可识别性判断之间的相关性。绘制的线对应于线性拟合。虚线对应于两个观察者完全一致的情况
图9显示了两个观察者的可识别性判断之间的相关性。数据点对应于在相同观察距离和相同传感器类型下记录的所有图像的平均值。两个观察者的判断高度相关,线性相关系数R=0.97。两个观测者的判断呈线性关系,其中观测者MH的估计值约为观测者PB的判断值的两倍。结果显示,观测者对目标识别程度的顺序意见一致,但判断的绝对值可能不同。因此,在比较合成图像和真实图像时,建议使用相同的观察者。
3.5讨论
可辨识性用少量的观测器和有限的测量时间给出了可靠的估计。研究表明,可辨识性与PID性能直接相关。因此,可识别性非常适合于比较合成图像和真实图像。
一般的方法是将图像降级,直到感知的可识别性达到阈值水平。我们选择使用模糊作为退化方法。原则上,也可以使用其他降级方法,例如添加白噪声。然而,模糊是确定有无传感器识别距离的主要因素之一,而噪声在较小程度上决定了识别距离。因此,使用模糊来估计ID性能是有意义的。
为了获得可识别性的可靠估计,最好使用训练有素的观察者,因为他们能够判断军事车辆的图像与其他车辆的图像之间的模糊程度。
与进行记录PID分数的实验相比,使用可识别性有几个优点。除了可以简单、快速和用有限数量的观测器获得之外,可辨识性使得估计单个图像的PID性能成为可能。合成图像/模型可以被评估和调整(在一个连续的循环中),直到可识别性与真实图像相匹配。
研究人员将视觉显著性和可识别性作为两种有效的任务相关措施,可用于校准旨在用于人类视觉搜索和检测任务的合成图像。
视觉显著性预测人类在现实和军事相关的复杂场景中的视觉搜索性能。显著性可以在现场(复杂环境中)或实验室中轻松快速地测量,这消除了对昂贵且耗时的视觉搜索实验的需要。现场测量和实验室测量之间的一致性意味着醒目性可以用来验证合成图像。
可识别性是一种有效的度量标准,可以用来深入了解人类的识别性能,而不必求助于复杂而昂贵的实验。目标可识别性在操作上被定义为将目标特征减少到其识别阈值所需的高斯模糊量。可识别性与PID性能直接相关,因此非常适合于比较合成图像和真实图像。
综上所述,通过将目标的显著性和可识别性设置为与现实世界中的目标相同,可以为人类视觉搜索和检测任务校准合成图像。