图文:美国国防情报局MARS数据库开发取得新进展
美国国防情报局(Dense Intelligence Agency,DIA)完成了新的基于云的数据管理系统开发的又一里程碑,最近成功发布了第二个最低可行产品。
机器辅助分析快速存储系统(MARS)被设计用来接收和存储美国情报组织收集的海量数据
机器辅助分析快速存储系统(Machine-Assisted Analytic Rapid-Repository System,MARS)被设计用来挖掘各个情报机构收集的大量数据,它利用云处理和机器学习来分析数据。作为负责向作战人员和决策者提供外国军事能力信息的机构,国防情报局希望MARS数据库在不同的情报系统之间建立联系,因为这些情报联系目前还没有建立起来。
美国国防情报局长斯科特·伯里中将在2021年4月5日发表声明说,MARS是国防部情报局不遗余力地追求各种手段收集和分析所有可能的外国军队信息,以支持美国军事计划、作战人员和决策者的另一个例子。
国防情报局宣布,MARS于3月31日发布了其第二个最低可行产品,用于初始作战能力的订购,该产品可“描述外国军事单位在其地理位置背景下的等级,以及分配给他们的装备。”MARS曾经在2020年发布了其第一个最低可行产品,重点是基础设施。国防情报局说,未来的MARS系统研发将继续发展增量扩展能力。
2020年标志着该项目的若干里程碑,该项目旨在取代已有20年历史的现代综合数据库(Modern Integrated Database)。今年8月,国防情报局向诺斯罗普·格鲁曼公司(Northrop Grumman)授予了6.9亿美元的合同,用于改造基于位置的对象服务(Location-Based Object Services,TALOS)的全源分析技术,旨在帮助该局构建大数据系统。MARS是合同的一部分,诺斯罗普·格鲁曼公司是该项目的企业模块化集成商。同样在2020年,MARS完成了它的快速原型阶段,五角大楼和国家情报局局长指定它为一个主要的采办项目。
现代化情报数据库(Modernized Intelligence Database),或称MIDB,建立于20年前,为国防情报体系提供全球情报数据。2018年,美国国防部高层领导人表示,鉴于当今数据的激增,无论是在开放世界还是商业世界,以及国防部可利用的众多传感器和机密渠道,MIDB都是不足的。
国防部正致力于用一个新系统取代其全球情报库数据库,该系统被称为MARS
新系统,即MARS,将利用存储、云计算和机器学习等现代技术,使分析人员能够以更动态的方式而不是静态的方式与数据和信息进行交互。
试想一下电子表格上的每一列都是一个工厂。这是目前做生意的方式。但工厂不只是静止不动地坐在那里,有人来来往往,有东西在生产,而且信息是可用的。
MARS将允许分析员将他们的理解从仅仅意识到工厂存在于纸面上转变为问一些问题,比如“为什么工厂现在没有生产什么?为什么六个月来什么都没做?到底发生了什么变化?”
MARS的研制将使美国情报部门能够提供警告的战略指示,并提供支持目标采集决策所需的情报。该系统一旦部署,将允许分析员和操作人员挖掘和处理大量数据,捕获新的数据源,以便更深入地了解对手的技术发展,提供跟踪静态和移动军事力量的能力,使接收的数据呈指数级增长,并利用商业最佳实践和行业技术进步。
对于终端用户来说,MARS将使他们的工作变得更加轻松,因为他们不必使用多个应用程序来获取所需的信息,只需要将数据注入到一个协作环境中。
此外,MARS将根据任务设置和特定的分析人员量身定制。基于云环境将使数据为机器学习和算法所使用做好准备,分析师的工作不是创建算法,而是让数据为它们所用。
从分析师的角度来看,要确保数据以任何规模准备好,并提出他们需要的任何问题。而不一定要成为世界上所有算法的终点。
国防情报局局长罗伯特·阿什利中将认为,快速推进这一项目的关键是利用商业领域已有的资源,国防部不应白手起家。
与军方正在进行的其他IT工作类似,领导人开始认识到,在技术变化如此迅速的时代,传统的业务处理方式(通过一个大型单一程序,由一个或几个承包商在几年内进行IT工作,并为其确定最终状态来规划所需的能力)是不够的。
我们需要确保这个体系不断发展和变化,这样它就不会被困在2018年,因为到2038年,我们还不知道这将是什么。
国防情报局希望在开发机器辅助分析快速存储系统方面迅速行动,但这个将改变情报界使用数据方式的大规模项目面临着一些棘手的问题。
情报组织在转向新系统时面临4大棘手问题
也许创建统一资源(如 MARS)的最紧迫问题是确保输入到系统中的数据以统一的方式进行标记和处理。说起来容易做起来难。据介绍,国防部有1,300个不同的数据标准。
使各机构和服务收集的数据具备可互操作,对MARS至关重要。国家地理空间情报局(NGA)在数据标准化和建模方面做了一些出色的工作,因为NGA在数据制作业务中已经有很长一段时间了。这方面可供借鉴。
MAR需要存储的情报界收集的数据数量惊人。例如,托管图像和视频,例如国家侦察局收集的图像和视频,占用了大量空间。
因此,MARS实际上不会托管所有数据本身。相反,MARS将关联由其他机构托管的情报。MARS需要能够对这些情报进行索引。从理论上讲,用户将能够单击链接来访问其他服务器托管的数据。因此国防情报局必须弄清楚该解决方案,以使MARS有效运行。
在开发海量情报数据集时,国防情报局希望所有情报都能得到解释,这意味着分析人员需要能够看到情报是如何得出的。换句话说,分析师和系统能否展示他们的工作。
一些情报机构和承包商并不想透露其情报信息或专有信息的搜集方法和来源,这是一个问题。MARS将不得不找出如何解释他们的情报,而不披露这些信息。
许多旧系统将无法移动到MARS框架。虽然MARS将包含所有MIDB数据,但一些旧系统将无法使用新系统,而只能继续依赖MIDB。
另外,过渡也很困难的。因为许多作战人员都受到传统技术的约束,无法马上关闭MIDB。
美国国会可能不会同时为这两个项目提供资金,那么在这些遗留系统能够被替换或升级之前,拟定解决方案是必要的。