机器学习在遥感影像分类中的应用
随着遥感仪器性能的不断发展,我们所能获取的遥感图像数量激增,且光谱特征维数不断增加,有必要利用机器学习对图像进行自动处理。本文概述了机器学习的主要方法及其在遥感影像的主要应用方向,并通过应用实例说明深度学习模型可以不断提高检测精度,解决传统机器学习难以解决的一些问题,带动遥感应用模式的创新。
机器学习是人工智能(AI)中最受欢迎和最成功的子领域,建立在概率统计的基础上,是计算机学科和统计学的交叉学科。
机器学习有利于计算机从海量的数据信息中提取有用知识,更好地指导各种应用中的信息处理和决策。
遥感图像分类是遥感图像信息处理中最基本的问题之一,其分类技术是遥感应用系统中的关键技术,分类方法的精度直接影响到遥感的应用发展。
遥感影像数据的分类实质上是一类特殊的空间数据的数据处理和模式识别问题,多种机器学习技术被广泛应用于遥感影像的分类中。机器学习算法的类型
机器学习技术包含的众多算法与模型可根据不同标准进行归类,一种广泛使用的方法是根据训练过程中得到的监督数量和类型,将其分为监督学习、非监督学习、半监督学习和强化学习。
使用监督算法需要训练数据集包含输入样本及其对应的输出值,输出值在训练模型时可用于监督调整模型精度,使模型逐步学习到输入输出之间的关系;而无监督算法只使用一个包含巨大数据量的样本数据集,依靠集群算法基于数据间的关系将数据分为不同类别。
半监督学习介于监督和非监督学习之间,使用大量缺乏输出的样本和少量已标记的样本,可有效减少获得标记样本的成本并获得精度较为可靠的模型。
强化学习中设置了一个决策反馈环境,算法在该环境中做出决策并立即得到环境反馈结果,根据反馈评估决策效果并不断改进决策能力。
随机森林
随机森林(RF)算法是一种基于分类和回归决策树的机器学习算法,特征变量的选择对其分类精度有重要影响。
对于不同类型的遥感图像,RF算法中特征变量的选取目前还没有通用方法,在特征变量的选择上还有很大改进空间。
支持向量机
支持向量机是建立在统计学习的VC维理论和结构风险最小化基础上的机器学习方法,根据有限的样本信息,可使样本误差最小的同时模型泛化误差的上界最小。
由于在文本分类任务中的卓越性能,支持向量机很快成为机器学习的主流技术,但在高光谱遥感图像分类中的应用研究尚处于起步阶段。
人工神经网络
人工神经网络(ANN)是一种模仿大脑神经网络处理信息方式的机器学习算法。
神经网络包含输入层、隐藏层、输出层,每层由一个或多个“神经节点”组成,每个节点代表一种数据处理方法,层与层的节点的通过权重连接,数据输入后通过层层传递完成复杂的非线性计算过程。
ANN以最少的输入集“学习”不同的图像模式,因为通常很难弄清楚计算输出的方式,也被称为黑盒算法。
近年来,ANN在技术上取得较大突破,人们设计出了隐藏层更多、神经节点间关系更为复杂的神经网络,算法精度已经达到甚至超过人眼识别精度,被广泛应用于包括遥感图像识别在内的各类机器视觉领域。
而以这类神经网络结构为核心的机器学习方法,也被称为深度学习。
深度学习网络
深度学习网络就是深层的人工神经网络,理论上来说参数越多的模型复杂度越高、增加隐层数目能完成更复杂的学习任务。
随着云计算、大数据时代到来,计算能力的大幅提高可缓解训练的低效性,训练数据的大幅增加则可降低过拟合的风险,以深度学习为代表的复杂模型开始受到关注。
经典深度学习以卷积神经网络(CNN)为代表的模型在图像分类中取得了巨大的成就。
但CNN的分类算法在进行卷积和池化过程中丢失了图像信息,无法提取出物体的具体轮廓,也无法指出每个像素具体属于哪个类别,无法直接应用于遥感影像的信息提取。
语义分割网络是深度学习的一个分支,将输入图像中的每个像素分配一个语义类别,以得到像素化的密集分类。
随着深度学习技术在计算机视觉领域的开疆拓土,图像分类、物体识别和语义分割任务等都获得了重大突破。
尤其是针对图像分割问题,UNet网络取得了不错的效果。
改进的UNet网络结构
机器学习在
遥感影像分类中的应用
云检测
要实现气象气候产品的高精度遥感反演,首先必须进行云检测,以确定每个像元是“有云”还是“晴空”。
现有遥感影像云检测方法主要基于特征提取的模式识别检测方法,并综合利用各种方法优化云检测的效果。
云像素的自动提取技术大多采用多特征阈值的思想,用固定阈值判断像元是否被云污染,但检测效果并不好。
Alan等利用遥感图像直方图变化情况动态获取云地分离的阈值,在此基础上,许多算法针对不同卫星改进了动态阈值的提取方法。
我国风云二号气象卫星(FY-2)的云检测产品基于动态阈值算法,采用滑动窗口和嵌套窗口的方法,一定程度上提高了云检测的精度,但需要大量的人工解释和阈值参数调整,算法的精度通常受限于仪器的通道和空间分辨率。
FY-2的云检测产品是许多定量产品反演所需要的重要输入数据,其质量对定量产品的反演精度有重要的影响。
云在时间和空间上都具有极大不确定性,导致卫星云图的特征不断变化,对云检测造成了较大的干扰。
FY-2云检测的误差极大限制了云的自动化观测水平,不可避免地影响后续业务化产品的精度。
因此,提高云检测的精度对卫星遥感信息定量提取以及产品真值检验具有重要意义。
深度学习可自动提取影像特征,并具有可迁移的特点,为FY-2历史资料再处理提供了新的思路。
近年来深度学习技术已开始用于分辨率较高、光谱通道较多的卫星遥感数据的云检测。
积雪检测
支持向量机算法既能处理非线性数据,又能有效地限制过拟合,被认为是目前针对小样本分类和回归等问题的最佳算法,在文字识别、语音识别等方面应用已卓有成效,并已开始应用于卫星遥感领域。
有学者利用深度神经网络进行积雪检测,与阈值法相比,效果较好,且具有时间和空间上的灵活性。
基于VGG网络的积雪检测评估
基于UNet++网络的积雪检测评估结论
深度学习模型可以利用大数据的优势不断提高检测精度,甚至在某些指标中取得了更优于传统机器学习的精度,且可解决传统机器学习难以解决的一些问题,如遥感应用中的全自动化积雪检测问题等。
未来的生态遥感应用中需要熟悉机器学习在所涉及的各类问题上的适用情况,并及时掌握科技前沿技术,可以最大程度地受益于每一次信息技术的革命性突破,以机器学习特别是深度学习技术带动遥感应用模式的创新,更好地迎接现代卫星气象发展的新挑战与新机遇。
本文作者:高昂,唐世浩,肖萌,郑伟
作者简介:高昂,国家卫星气象中心,博士,研究方向为机器学习;唐世浩(通信作者),国家卫星气象中心,研究员,研究方向为卫星遥感生态环境与灾害监测评估应用。
论文全文发表于《科技导报》2021年第15期,本文有删减。