1 说在前面
笔者做了7年遥感应用相关的工作,以主要负责人角色做过数据生产、编辑终端软件开发(包括基于ESRI体系和开源体系)、自动解译算法研发(包括传统机器学习和深度学习)、研发管理、新数据产品设计与研发、遥感行业解决方案设计与研发,参与过若干个863计划和国家重点研发计划项目,客串过航天摄影测量系统研发,偶尔充当售前和项目经理,还做过公司管理,所谓的事业部经理、产品总监、运营总监等,基本把所有工种都做过了一遍。(下图来源于网络)
做了这么多事情,了解的最深入的还是遥感解译这块(从需求到解决方案),在解译技术上亲身参与了基于传统机器学习像元级分类、对象级分类,时序影像分析,以及基于深度学习的分割、检测、识别。见证了AI遥感从突然兴起到逐渐恢复理性的全过程,行业内成功的案例有,但失败的案例更多,认为根本区别还是在于以下三点:1)是长期主义还是暴发户式崛起;2)是贴近用户实际需求还是炫耀技术能力;3)是专注于解决具体问题还是始终说不清能干什么。相比于码农,笔者更愿意将自己定义为遥感应用领域的老油条:一个方面较为精通,行业内其他领域也都略懂,也大都亲身参与,笔者环顾四周,有类似经历的人好像没有,偶尔自豪(啥都干过),偶尔又有种悲凉(35岁好像越来越近了,财务自由目标越来越远了)。下图来源于网络。
以后不管会具体从事什么职业做什么工种,应该不会继续码太多代码了,但偶尔想(犯)了(贱),还是想再码一码,那码什么好呢?人工智能这块更新换代快,几天不跟,就跟不上形势了;航天摄影测量好像也没啥普遍需求,不精通,也太烧脑;还是做个小工具软件吧,后面,有想法就加点新功能,顺带做个几年,搞不好也能做成一个有人愿意用的软件。做哪一块的工具呢?解译最熟悉,当然还是做解译,就先从数据打标签和样本分析做起吧!随着技术的发展,有些功能可能已经没有用处了。那,so what?哎,就是玩儿。这已经是少数感兴趣的技术领域之一了。
2 GeoLabel是什么
都知道,当前的人工智能有多智能,背后就有多少人工,这个人工很大程度指的就是数据标注(现在还是不是这样,没做过调研)。在实际业务中,如何减少数据标注的时间消耗其实是个很重要的课题。GeoLabel在遥感影像标注上做了一些简单的工作,可以提升标注的效率和标准化程度,并可辅助建立企业级的标准样本库,支撑大规模应用。对于遥感影像标注,当前也有一些工具,但是都是站在研发的角度来写的,非常笨重,不易部署,且功能单一,与通用的标注工具(labelImg、labelme等)无异。我们知道,模型的泛化能力是一个算法模型是否实用最重要的指标之一,而对于遥感影像来说,模型的泛化主要就体现在:区域(地形地貌)的适应性、时相的适应性、传感器特性的适应性、色彩风格的适应性等。如果抛弃这些遥感影像特有的特征,而仅仅将其作为普通图像问题处理,很难做好遥感方面的算法模型。GeoLabel提供了遥感数据标注全流程的解决方案,为每个样本保留了时相、分辨率、传感器、影像源、空间坐标等信息,为大规模标准样本库建立提供了条件。GeoLabel本身是一个小型的GIS软件,具备丰富的编辑功能(稍加改造就可形成一个便捷易用的轻量级桌面端GIS软件),同时,针对数据标注做了大量的定制,可以满足各种类型的样本标注工作,如:地物提取、边界提取、变化检测、目标检测、时序分类等。如果说还有什么有特色的地方,都是很小的点,如假如没有遥感影像,支持直接从网络公开地图(如百度、高德、谷歌等)上生成样本影像,而无需将网络底图影像先下载下来;如果已经有矢量解译成果了,可以直接基于矢量成果和影像生成样本成果(提供矢量成果标签与样本标签的自动转换);提供一般工具不会提供的时序分析工具(支持像元级和对象级的分析);变化检测标记支持卷帘和双视图同时使用;提供了规范的分类体系,也可以自定义分类体系;提供了针对样本的快捷渲染样式,等等。
3 GeoLabel能干什么
GeoLabel可以做几乎所有遥感AI应用的数据标注工作。实际上,GeoLabel能做的事远远不止于样本标注。本文只介绍部分功能。
3.1 单期分割、检测类标注
目标分割、边缘检测、变化检测、目标识别的流程类似,主要包括:点击“工程”-“新建”,弹出创建工程对话框,进行参数设置,点击“确定”,完成项目创建。
① 遥感影像(如融合影像、镶嵌影像、航片等)
② 地图服务(如公开网络底图,百度、高度、谷歌等,也可以是自己发的地图服务)
对于基于已有矢量成果数据生成样本,还需要导入成果矢量。
在相应的“分割”(或者分类、变化检测、目标检测)选项卡,设定目标影像(如果是服务图层,还需要设置分辨率,也就是影像级别)和样本影像的尺寸,点击“启动选样”,即自动生成样本点图层。
点击“样本选点”按钮,启动样本选点。鼠标移动过程中,会实时动态显示样本块范围,且随视图缩放自动调整大小。
另外,针对现实过程中样本影像源可能来源于多个数据的情况,样本选点时可为不同样本设置不同的影像源。下图就分别从影像和高德地图上选了样本点。
3.1.4 样本生成
样本点选择完成之后,可点击“样本生成”按钮,开始裁切样本影像。在工作空间的image目录生成了相应的影像块。
3.1.5 样本标绘
点击“启动标绘”,出现样本标绘控制窗口。
样本标绘控制窗口集成了丰富的样本编辑控制功能。包括快捷属性赋值、快捷渲染、样本状态标记(标记完成打上勾)等,与编辑工具配合使用,可以快速标准化地完成样本标绘和质检。通过上一个、下一个按钮(也可通过向上箭头、向下箭头快捷键)一键加载下一个样本(包括影像和矢量)并移除当前样本,并自动完成渲染。通过标记完成、回退按钮将当前样本标记完成和去除样本的完成标记。通过勾选“概览”,可以在画布中看到工程中所有的样本。
提供了丰富的编辑工具,进行各类样本的标绘。
3.1.6 矢量标签转栅格
点击“转栅格”,将矢量标注文件转换为栅格形式。
3.2 基于已有矢量的样本快速生成
对于已有矢量成果,通过简单设置,即可快速生成样本。当然,实际作业过程中,直接已有矢量成果是达不到样本的要求的,需要进行细节的调整,但工作量相对于重新标注就小太多了。具体调整方法就是使用“样本标绘”小节中描述的方法和提供的工具进行编辑。
3.3 单期分类标注
对于目标分类,选样完成后,直接点击“样本生成”按钮后,直接生成样本块,无需后续编辑。
3.4 时序分类标注
通过“时序配置”,选择时序类型(像素级、对象级),对于像素级,可以设置指数公式,选择时序影像路径后,点击“加载”,完成时序数据配置。
提供丰富的指数曲线和时序影像展示功能,直观地选取和分析样本。
3.5 变化检测标注
支持卷帘操作和双视图同时进行,可以即时可视化并勾画变化区域,无需反复卷帘操作。
3.6 管理和配置功能
3.6.1 快捷配置
包括快捷键设置和各种影像默认显示波段组合设置。
3.6.2 分类体系管理
提供标准的分类体系管理功能,可以修改并添加分类体系。