付诸实施——将人工智能融入算法战
●作者/考特尼·克罗斯比(Courtney Crosby)博士
●译者/昀峰
●校对/Nangwa
●取材/军事评论2020年7 - 8月刊(美)
1
2
3
冲突的胜负取决于军事抵消,或者是防御部队具有非对称对抗的优势手段。随着大国竞争、对抗性技术的劲敌和不断扩大的威胁,人工智能(AI)大大增强了传统的抵消手段。1然而,国防部(DOD)运营人工智能的能力还处于萌芽之中。2五角大楼最初采用的人工智能程序着眼于将其商业能力转移到国防部门,从而突出了技术性能,削弱了面向任务的功能。3因此,最初的试点项目未能进入实际作战环境(OE)。
运营人工智能
4
理解决定运营。人工智能不是一个结束状态,而是取得军事优势的一种方式。为此,人工智能相关方法论的技术实现必须与作战环境(OE)联姻。这种考虑偏离了传统的思维。因为典型的人工智能解决方案通常是为了达到一定的统计阈值(例如,召回率、精度)而研发,并非基于军事目的(例如,增加对峙距离)。4
5
这一动态被涵目前盖了军事和技术特征的“算法战”这一术语所混淆。算法战的目的是作战人员的伤亡数量,提高时间为要的行动中的决策速度,以及在人类无法行动的时间和地点行动。5然而,这些目标中没有一个与数学或计算机科学有关;它们直接建立在军事终结状况的基础上。问题是,在五角大楼步入其AI轨道之前,从未建立军事终结状态同科学、技术、工程和数学学科之间的桥梁。所需桥梁就是指导和评估AI运作的框架,一边连接算法性能,另一边是任务功效。这种组合确保了数学方程可以证明或用数值验证人工智能系统,而定性基准(测试程序数值)则保证了实际应用。其结果是算法战不仅基于统计,而且是一个为更广泛的行动相关性的架构。这种相关性性有五个要求:
·最低可行性,
·适应未知(事务)和未知场景的能力,
· 对信息的洞察力的优先排序,
应用所需的自主水平,和
·战场备战状态。
这些要求首次为评估军事人工智能程序和确定其是否成功奠定了基础。
2020年2月5日在马里兰州米德堡(Fort Meade)拉斯韦尔大厅(Lasswell Hall),海军陆战队部队网络空间司令部司令和陆战队员观察计算机运行。陆战队员实施网络攻防行动,以支援美国网络司令部。陆战队员操作、保护和防御海军陆战队企业网(MCEN)。(原始照片由美国海军陆战队雅各布·奥斯本(Jacob Osborne)上士提供。照片有修改。)
技术方法论和防务理论的联姻
6
为军事人工智能程序开发效能评估(MOE)需要为防务理论描绘技术研究和技术方法(例如,基础理论)的图谱。6没有这样的图谱,算法战就会被简化为算法开发过程,而不是运营部署过程。例如,设计用于检测视频中物体的计算机视觉算法(例如,地理空间分析)缩减该模型找到的车辆数量或者说找到这些车辆的准确性。故而,(算法)的成功是算法用85%的时间正确地找到车辆(而取得)的某种效果。
但是在军事行动中,在85%的时间里检测车辆有什么用呢?这就是需要引入(评估的)语境之处,来维护条令的完整性。以上面的例子为例,同样的算法被评估的不是正确检测车辆的频率,而是它对任务的影响:分析师感兴趣的是由该模型识别出的95%超速的车辆。这种方法将算法的设计的好坏与其任务部署联系了起来。虽然这似乎是常识,而且在项目文档中甚至可以模糊地表示这种关系,但在国防部(文件中)的任何一处都没体现其单独的标准。
评估标准仍然需保持解决方案的独立性(即,无论情报类型、使用的算法、部署的行动环境或任务要求如何,这些标准都适用)。因此,在研究中,人工智能原理要被编纂成可量化的属性和指标,而这些对于系统和程序是不可知的。评估标准也以一种“过-不过”方式表达,用与相关的联合出版物有相同的含义,来创建一个逻辑的、自上而下的层次结构。其结果是形成调节、监测和评估国防部人工智能系统的基准线。
技术方法论和防务理论的联姻
7
如前所述,可运营的人工智能是由任务功用的五个方面定义的:最低生存能力、适应未知和未知场景的能力、对信息的洞察力的优先排序、应用所需的自主水平和战场备战状态。每一条MOE(效能评估)都是算法战的基础。7对这一信息的分析为每一条MOE(效能评估)形成一个有指标和效果的综合框架。整个框架以条令的定义和程序为基础。
衡量有效性
8
衡量有效性的军事过程依赖于一个“过-不过”、自上而下的架构。这意味着,只有当该衡量条目的每一个指标也存在时,才存在该衡量条目。同样,只有当该指标的所有效果也存在时,才有指标。8它是一个二元的、“有或无”的过程,可以像常规军事活动一样容易地应用于人工智能。
在传统的高价值目标(HVT)寿命模式分析的案例中,效能评估(MOE)会定义军事战役的一个预期结果(例如,HVT移出责任区[AOR])。必须满足效能评估(MOE)定义的所有指标,以便成功不能任意或有选择地出现。例如,情报应表明:(a)在新的责任区(AOR)中侦测到高价值目标(HVT),(b)在新的责任区(AOR)中检测到已知的高价值目标(HVT)关联,(c)高价值目标(HVT)在新的责任区(AOR)中获得基本的生命支持系统(例如住房、运输)。随后的效果遵循同样的过程:支持指标“a”的效果可能包括识别已知的物理特征和通信信号。
因此,虽然常规的和人工智能的效能评估(MOE)在策略实现上有所不同,但决策验证的底层系统是相通的。只有在对人工智能领域的理解有一个基准线的情况下,人工智能效能评估(MOE)才可验证。这与英特尔分支机构开发的效能评估(MOE)无法通过战斗兵种验证的情况如出一辙。
执法车辆和人员识别系统演示。2017年11月1日华盛顿举行了英伟达(NVIDIA)GPU(译者注:图形处理器)技术会议。期间的大会展示了人工智能、深度学习、虚拟现实和自动机器(也有译为自主性机器)。(照片由法新社索尔·罗卜(Saul Loeb)提供)
描述有效性——技术波峰
9
10
11
算法战争是通过人工智能手段进行的战争。人工智能的手段不仅是智能的(收集和应用洞察力),而且是人工的(以人类做不到的方式作用于情报)的手段。没有人类的干预,系统必须学会如何为自己描绘数据。9另一个术语称之为机器学习。机器学习有不同的类型。但在战场上,非监督式机器学习将成为金标准。因为它具有从未知的和非结构化的信息中获取输出的能力和灵活性。10在这一金标准中,一种称为深度学习的特殊方法在更精确地表示复杂问题的能力方面是独一无二的。11鉴于战场的动态性,更准确地描绘复杂问题的能力至关重要。
因此,算法战只能这样激活:(a)工作系统(最小可行的)的能力(b)从未知和不可知的场景(无监督)的自主学习,(c)将复杂的战场环境中转换成一个有用的见解(启用深度学习)(d)几乎没有指导(自主)和(e)在实时任务(战地)环境。这些效能评估(MOE)和图中的架构是运营人工智能的第一步;他们为如何整合技术和操作因素奠定了基础,同时使任何人工智能程序的“成功”标准化了。
运营人工智能必须展开工作
最小可行性测试算法战是否积极地改变了作战环境。“积极改变作战环境(OE)”意味着证明了部署人工智能存在竞争优势和性能改进。这种理由来自行业指标(技术因素)、与类似系统的排名以及对人类操作人员的实用性。
以翻译为例:一个自然语言处理算法将最小可行的,如果(1)行业指标证实,它准确地完成地面真值数据和正确的语言之间的转换,(2)该算法比其他算法在相同的技术类别和作战环境(OE)好,和(3)机器翻译超过人类。
与最小可行性相关的竞争优势和性能改进因素是必要的。因为没有它们,非算法衍生的战争(模式)将更有效——这从而否定了对运营人工智能的需求。
灵活和可适应的系统
12
记住,无监督算法是现场任务最理想的选择,因为它们的灵活性和即使在未知的场景也可获得见解的能力。12简而言之,无监督系统可以在没有预定信息的情况下运行,并在新信息可用时学习。
从与敌交战的例子中可以描绘出一个常规的等效值。例如,部署的现役人员直到战斗结束后才知道战斗将如何展开。然而,他们被期望在没有警告的情况下对敌人的火力作出适当的反应,并对新的敌对行动(机动和活动)得出相关的结论。
成功的算法战程序就需要表现出与现役人员相同的随着时间推移(而提高)学习力和战术执行力的适应性。
降低任务复杂性
13
回想一下,深度学习降低了复杂性。13实际任务中降低复杂性是指如何表示和理解信息的。就像人一样,有效的算法战有赖于模式检测、推理和解决问题。
图:算法(人工智能)战争的有效性度量
模式检测本质上是获取知识,然后可以推广到预测未来的未知场景。假设部署到机场的非航空机构现役人员看到直升机在空中飞行。那个人注意到直升机独特的物理特性,如整体尺寸或纵列旋翼。独特的特性将直升机与其他各种类别的区分开来,随着时间的推移,现役人员可以使用学习到的视觉提示在整个机队中选择正确的直升机。人工智能以几乎同样的方式识别视觉图样;直升机特征是在随后的观察中重复学习的。然后将这些特征推广到区分一架直升机与另一架直升机,或直升机与非直升机中来。
推理细化了知识的获取,以便检测环境中的微妙之处,并在逻辑上将这些微妙之处联系起来。例如,如果直升机从来没有看到某些天气模式,推理将推断天气(作战环境(OE)的一个次要因素)影响飞行能力。有了人工智能,恶劣的天气还会再次确认没有旋翼的飞行物不是直升机。
最后,顺序解决问题将一个大问题(即如何驾驶直升机)分解为更小的问题(即飞行路径是什么、有多少燃料可用、需要多少飞行员等。)。因此,如果不降低复杂度,算法战将缺乏将信息转换为洞察力的能力。
操作(运行)小到无需指导
由于算法战争假设利用非人类手段,人工智能必须独立地组合和判断行动过程。人工智能必须根据自己的决策、反应能力和态势感知来完成这一裁决。
决策是在环境中发展和解决选择的事情。在给定的通常情况下,面对相互冲突的情报、监视和侦察飞行路径,指挥官将开发一个资产优先矩阵,然后根据这些条件化解矛盾。这不仅仅是提供可行选择的问题,也是要弄清哪些办法对整个任务最有利。为了做到这一点,系统必须能够融合决策标准(例如,资产数量、收集要求、飞行时间等等)。传感器必须参与确定决策标准(例如飞机燃料计(译者注:指测量仪器)或人/语言提示)。然后,所有可用的选项都必须删减。最后,系统必须识别当前状态的变化,并对该变化产生的新信息作出反应(即航空资产的就位(译者注:空中待命)时间已经结束,因此不再需要解决矛盾冲突)。
反应和果断是相辅相成的。也就是说,系统能否对它以前从未见过的关于所需时间轴的情景作出适当反应?要做到这一点,系统必须具备态势感知的必要功能:摄入、处理、迭代和行动。所有指标一起确保运营人工智能改善决策时间轴,而不是抑制它们。
将人工智能带入现实世界
“由于任务的限制是巨大的,不预先考虑人工智能如何在现实世界中运行,那么就无法在实验室中开发人工智能。”
战场战备状态是衡量系统是否能在实地任务空间中功能发挥的一个指标。由于任务的限制是巨大的,不预先考虑人工智能如何在现实世界中运行,那么就无法在实验室中开发人工智能。显然,实验室人工智能的局限性不会被战场所绕过,而是被放大了。开放架构受到军事基础设施的限制。不可知论(怀疑?)的管道被孤立、传统的系统堵塞。一旦普遍的高速网络向前方部署,网络就会变得零星或断断续续。而且及商业部门未被清理的专家被几乎没有AI专业知识访问受限的用户团体所取代。
简而言之,人工智能必须补充而不是扰乱正在进行的行动。从一开始就必须解决任务的制约因素,包括与现有系统的整合和通联。此外,应测试或鉴定这种集成整合,以便在部署之前验证该功能及其左/右限制。这在很大程度上与军事人员具备部署能力的范围相同,或者反过来说,多差的适应性测试会导致部署能力不佳。
五个用于运营人工智能的效能评估(MOE)共同代表初始和全部作战能力(IOC/FOC)的标准阈值。利用效能评估(MOE)框架中的决策门进行的初始作战能力(IOC)/全部作战能力(FOC)的测定将加速人工智能的运用,并提高美国在算法战领域的定位。
军事人工智能发展的目标之一是:在战场上将人力情报特工组中的士兵与无人车辆直接联网。这将加速情报收集、目标识别和执行火力任务。(美国陆军供图)
建议
如果没有一个用于运营人工智能支持算法战争的框架,当前的国防部项目会遭遇失败。本文提出的框架是第一个在防务人工智能领域内定义“成功”的框架,并将为政府监督提供必要的可审核的测定方法。
虽然本文的目的是算法战的不可知论解决方案,但还需要进一步的研究。应指定资金用于将该框架与具体系统、学科和项目相结合。为支持这一努力,使用机密素材和对机密系统进行定量试验同样至关重要。定量实验不仅有助于验证本文的前提,而且还可以开始创建一个网络来比较和改进防务人工智能的测试和评估。也就是说,在跨越多个环境、系统和问题集中持续、一致地使用效能评估(MOE)架构将使人工智能项目在一个单一的、共同的评估框架下保持一致。为此,本文提出的效能评估(MOE)架构支持两个功能:(1)通过迭代改进“过-不过”决策门结果来实现更有效的系统;(2)通过比较各自的效能评估(MOE)对不同的系统进行判定。
从战略上讲,图中概述的体系结构(第46-47页)应该集成到国防部的采购、技术和后勤过程中。目前的范式不是为指数增长的和非传统性质的人工智能程序而建立的。围绕目前的评估标准对当前和未来的国防部人工智能解决方案进行校准,将使之标准化,同时加快耗时的采购进程。此外,负责企业人工智能活动的组织机构应将框架标准化,使其更快地将应用研究和开发转化为业务用途。
然而,组织机构的努力不应停留在政策上。目前,国防部没有利用军事人员开展人工智能活动的机制。尤其是,没有与人工智能相关的军事职业专业(MOS),也没有官方系统来识别和分配人工智能项目的熟练人员。其结果是缺乏可用的复合型人才——既精通人工智能又精通任务的人员。建立一个数据科学或面向人工智能的军事职业专业(MOS),类似于在网络领域发生的情况,将使人工智能能力的运营更加可持续。可以通过增加合格的军事人员,扩大经过清理的人工智能专业人员的人数。或者,传统的军事职业专业(MOS)可以适应现代战争的特点。例如,特定学科的情报分析师可能与多(译者注:域、类)情报融合的世界无缘。修改或添加人工智能技能标识或专业将抑制军事职业专业(MOS)相关性的衰退。
在战术上,五角大楼对人工智能的推动需要伴随着一场自下而上的运动,这样形成的组织机构就不会简单地交给一个没有(知识)背景能力(的人手中)。相反,从战斗带来的抵消(方面)他们应该有一个积极的声音。基层的努力可能包括在初始和全部作战能力(IOC/FOC)设计计划之前,在部队级别进行影响分析和压力测试,以了解脆弱性和优先性需求。
建议
运营人工智能是一个固有的以任务为中心的努力过程,必须在战术上有意义,才能产生战略影响。在基层部队获得实际投资回报之前,围绕算法战价值的广泛质疑将持续存在;因此,对抗优势将成为一个越来越无法取胜的现实。
14
15
如果没有运营这些程序的框架,国防部就不能继续执行人工智能项目。14本文中提出的架构只是通过加速和标准化政府通过高度创造性、操作吸引力的技术开发人工智能能力的努力来做到这一点。15
考特尼·克罗斯比(Courtney Crosby)博士是博思艾伦汉密尔顿战略创新团队的首席科学家。她拥有决策科学哲学博士学位,聚焦于国防部的战场人工智能(AI)系统。 克罗斯比(Courtney Crosby)曾多次参与各类海外支援任务部署。她是军事C5ISR领域的人工智能运营和创新的先锋。 她以前的经验包括研究和开发与人机合作相关的新兴能力和社会科学分析。