知远战略与防务研究所 沐俭/编译来自:美国战略与国际问题研究中心网站【知远导读】本篇推送编辑节选自美国战略与国际问题研究中心(CSIS)技术与情报专项研究小组撰写的一篇利用新兴科技提高情报分析人员的战略情报分析能力的文章,原题为The Analytic Edge:Leveraging Emerging Technologies to Transform Intelligence Analysis。本文首先研究了将技术集成到情报分析过程中的新方法,然后就将人工智能和其它技术整合到战略分析中的关键障碍和限制进行了讨论,最后探讨了在AI及大数据时代,情报分析人员应如何提高自身的战略价值,并为决策者提供最大化的情报价值,以及构建未来情报体系的意义。如果美国现在投资于技术转型,2030年的情报分析人员将会以难以置信甚至同情、怜悯的眼光来回看2020年的同行们。凭借世界领先的人工智能、前沿数据分析和无限的云计算能力,未来的分析员将能够几乎持续地掌握他们的目标作战环境。从开源情报到高度机密情报的一切信息领域,他们都将能快速地在所有信息范围内挖掘、融合、可视化和使用高质量数据。他们将能迅速向政策制定者提供高水平的、具有丰富数据的建议。对于前辈们采用的权宜分析技术,以及过时的“读、写、想”的分析过程,未来分析员们或许会耸耸肩,认为这都是过去时代的遗风,与大数据时代的速度和规模毫不相容。然而,2020年的情报分析人员们既没有时间,也没有兴趣去考虑这种幻想出来的未来情境。随着数据量呈指数级增加,他们处理数据的能力也会略有增长。他们的监视器充满了多条情报排列、使用孤立的共享驱动器、手动管理的电子表格和数据库以及错误百出的kmz文件,没有接口来合成数据。他们被提供给他们的众多“新工具”和“人工智能解决方案”搞得手足无措,对它们的实用性和战略分析可用性感到失望。在客户的要求和时间安排不间断的情况下,分析员们会默认使用他们惯用的那一小套可信赖的孤立信息来源和经过时间考验的情报技术来收集信息,并提供一份“足够好”的、或多或少准时的情报产品。虽然目前的情景不像上述的那样黯淡,未来可能也不像上面说的那样光明,但情报部门的分析员们在2020年确实完全滞后于技术水平曲线。数据和颠覆性技术的爆炸式增长,新的全球威胁的快速演变和出现,以及政策制定者决策周期的加快,很可能会颠覆情报分析过程。情报部门如何快速地将先进技术集成到全源情报分析中,将对其在未来情报环境中的竞争能力以及提供及时、准确和相关的分析产品非常重要。在对未来的情报分析员进行展望和塑造的同时,情报部门能够而且必须利用新兴技术来增强分析人员的能力。新技术在情报分析工作中的局限性对于分析人员而言,虽然人工智能和相关技术所带来的优势可能是巨大的,但情报部门在将这些工具应用到全源分析方面则面临着一些关键的障碍和限制。研究小组在第一阶段确定的技术获取、数字基础设施和数据架构的广泛挑战阻碍了情报收集和处理任务,这也将影响到情报分析任务。但结构性障碍既不是唯一的障碍,通常也不是主要障碍。阻碍采用新兴技术进行分析的主要原因是技术在满足分析人员的情报和可解释性标准方面的自身局限性,以及分析人员和机构对其传统情报和分析方法的文化和制度偏好。数据获取和融合准确而有洞察力的人工智能应用需要捕获、整理和管理一定的数据。用于分析的潜在相关情报和数据的绝对数量可能超过了技术能力很强的分析员的处理、过滤和吸收能力。数据集标准化和融合所面临的挑战将进一步使数据的利用复杂化,这些数据集既有通过密悉方式获取的,也有从公开来源收集的。跟上数据发展步伐情报部门融合情报和数据处理工具的速度和规模必须要跟上情报和数据不断增加的数量和多样化的步伐。即使人工智能实现了优化和精简,传感器、情报流和开源情报数据的激增(5G网和物联网设备加速了这一进程)仍然会使分析人员的处理能力不堪重负。无法捕获和分析实时数据将使情报部门分析员在向决策者提供态势感知方面落后于标准曲线。数据融合对于分析员来说,最好的人工智能应用程序将能同时利用密悉和开源情报数据来训练算法并获得见解,但不兼容的架构和安全壁垒可能会阻碍“低端”与“高端”数据的融合。与数据一样,机器学习算法和开源模型在移植到机密系统和集成到分析工作流时也可能面临类似的障碍。数据标签最好的人工智能应用程序也需要大量的数据,而这些数据又需要大量的标签和标记——这是一项冗长、耗时且主要是由人工来完成的任务1。与私营部门可以众包并雇佣“零工经济”标签者不同的是,情报部门的机密数据集需要在内部进行标记,而且大部分工作是由分析人员手动完成。虽然在短期内完成这些工作并非不可能,但随着数据继续呈指数级增长,手工标签和标记将不堪重负2。算法的限制分析依赖于严谨的情报技术和对用于得出结论的逻辑、证据、假设和推论的清晰解释/推理。战略分析的复杂性,透明度及情报保障的标准和要求,以及建模分析过程和功能的内在挑战,将对目前人工智能分析工作流程的使用产生理论和实践的限制。 战略分析建模复杂的情报技术和战略分析认知技能天生就难以定义、标准化和复制,因此也难以建模,从而给人工智能应用带来了实际限制。将新情报的含意置于环境中并加以识别,权衡并连接数据以形成情报图,将情报根据逻辑组织起来并有说服力地进行论证和评估——这一分析过程融合了艺术与科学、标准化情报技术应用和情报研究员的灵性与悟性,以及从硬数据、演绎推理、文化专长和长期磨练出的分析直觉里得出的判断。如果分析任务不能实现数字化,那么应用人工智能的能力将会受到限制3。偏差人工智能中生成见解需要分析人员帮助塑造、完善和引导算法与模型,但分析人员在对情报问题进行概念化、设计模型和选择输入数据的方式上会存在偏差,从而导致有偏差的、可能不准确的结果。数据中固有偏差的透明度、模型的使用方式以及它们对结论和信心水平的影响将是至关重要的,但客户可能不容易理解4。可解释性为了应用人工智能得出的结果,分析人员需要了解产生这些结果的算法和模型的逻辑、偏差、假设和推论——这些可能是可知的,也可能是不可知的。许多最复杂的人工智能应用程序和机器见解都源自“黑箱”算法,在这些算法中,机器逻辑和流程很难定义(如果不是不可能的话)。缺乏证据链的透明度,在哪里和如何使用人工智能,以及有效性条件等意味着机器得出的结论或将是不可信和不可用的5。真实性分析人员必须不断评估情报的质量、准确性和相关性,同时学习如何衡量一个曾经被视为理所当然的新因素:真实性。通过欺骗算法来使数据误分类的技术,以及利用生成性敌对网络6来对密悉和开源数据进行深度伪造的技术,可能会对分析人员造成混淆,从而导致分析失误和政策决策错误7。随着对手变得越来越善于篡改数据,并以更快的速度和规模发动有针对性的虚假信息欺骗行动,确保数据和情报的真实性只会变得更加困难。安全性分析人员还将面临来自敌对国情报机构咄咄逼人的、有针对性的人工智能对抗行动,这些情报机构旨在渗透和破坏人工智能系统,并由此影响分析人员对人工智能工具和结果的信心。匆忙采用人工智能可能会以严格的人工智能安全标准、协议和测试要求为代价,给一系列“反人工智能”威胁带来漏洞,这些威胁包括注入到人工智能模型内的“有毒”数据,以及被完全入侵和操纵的系统8。即使对手无法获得如此级别的访问权限,让分析人员相信他们的人工智能系统已经受损、无法使用,也可以达到同样的效果9。在分析上厌恶改革尽管技术上的障碍是巨大而真实的,但人工智能应用的最大障碍或许是分析员自己。在情报分析领域,根深蒂固的是机构、官僚和文化上的偏好,以及对他们认为是全球黄金标准的久经考验的情报术和技能的偏爱。对数字智慧的投资不足、人工智能和开源情报任务价值的不确定性,以及对风险和变化的文化厌恶,可能会阻碍最具创新能力的分析人员和部门将新兴技术融入到他们的任务中。数字素养分析人员需要具备基本的数字技能,以便在分析中有效地利用人工智能和分析工具,并向甚至不太精通数字技术的政策客户解释由人工智能得出的见解。要发展这些技能,分析人员不仅需要受到专业培训,而且还需要得到领导和管理层的支持。然而,机构领导人需要在对数字技能的投资与传统的情报技术、语言和其它区域性培训之间取得平衡,这些也将对情报部门的分析能力至关重要。官僚主义障碍人工智能投资需要多年的承诺来贯彻实施和整合,需要社会资本的管理支出来获得机构支持,还需要领导层对风险和偶尔失败的接受。然而,中高层管理人员往往只会在他们的职位上呆2-3年,他们可能不愿意把自己已经紧张的时间和资源花在任务回报不确定且有失败风险的新技术上,特别是如果他们的情报部门领导人和监督机构不鼓励这种冒险的话。任务价值如果分析人员和管理人员没有从技术中看到明确和实质性的“任务收益”,那么培训、激励和领导支持可能仍然不足以激发采纳技术的热情。见解和生产力的边际收益可能无法证明获得人工智能和分析能力所需要的时间、费用和机会成本。分析员也可能被提供了太多的技术工具,以至于看不到任何工具的价值,特别是那些没有专门设计和定制以满足其独特分析需求的工具。对传统情报技术有信心和信任的分析人员,更有可能放弃,不采用其自身不能适应的新技术。对非传统方法的信任利用人工智能能力需要将开源情报作为重要的分析来源,并学习如何获得对机器导出结果的信任。阻碍新技术的采用是情报部门对构成判断的密悉报告的偏好,对开源情报作为诊断数据的怀疑(这种怀疑只会随着深度伪造和虚假而增加),对人工智能安全的担忧,以及对经过时间考验的情报技术而非黑箱程序的信任。对密悉报告的偏爱或许是无可厚非的,因为一个信号情报的截获或人力情报来源可能是唯一的辨别计划和意图的方式。然而,在等待密悉信息被收集和处理的同时,忽略了及时、实用的开源情报见解,将会使分析人员滞后于决策者的信息需求和决策周期。新技术时代专业情报分析人员的战略价值很明显,在权衡其优势和局限性时,人工智能、云计算和高级分析等新兴技术可以通过自动化来完成关键分析任务,为分析员创造更多的战略带宽。但是技术为分析本身创造的价值是什么呢? 高水准的分析必须为决策者解答复杂的问题(例如,一个盟友和敌对势力之间的冲突前景如何? X国的大规模抗议会不会演变成内战)?要回答这些问题就需要回答一系列相互关联的子问题,这些子问题必须联接成一个连贯的分析故事,即:发生了什么,为什么,它的影响,它的前景,以及对美国的利益有哪些影响。那么,新技术在哪些方面最有助于解决这些问题呢?技术的直接价值在于能解决如何捕捉、整理、关联和理解海量的情报和数据流等问题,这些数据与分析员所在的国家、问题或所关心的目标有关。技术还可以帮助分析人员评估影响——探测和衡量问题或行为者对作战环境的影响。人工智能和相关技术的滞后回答了原因。理解外国行为者的驱动因素、意图和动机,以及塑造他们行为的历史、背景和个性,这些主要属于人类学专家的领域。随着人工智能技术的进步,它可能会越来越有能力确定这些驱动因素,从而帮助预测问题的发展前景。但目前,解释情报对美国决策者的影响,仍将是人类分析员的独特优势。虽然新兴技术将为情报部门的分析提供巨大价值,但在未来几年将出现另一个问题:情报部门的分析本身对美国政策的价值到底有多大? 尽管情报部门仍将享有许多优势,如在密悉情报收集方面,但高质量的开源情报、可从商业渠道获得的地理空间情报和信号情报以及数据分析的结合将使情报分析竞争变得更加激烈。任何受过训练和装备精良的组织都将能够以更快的速度和更低的成本对当前事件进行全源分析,其质量可与情报部门的分析员相媲美。在未来越来越普遍的传感器和持续感知的信息环境中,商业部门更快的技术采用率和开源情报的优越设施可以使其在评估快速变化的全球事件方面比情报部门更具优势。在向美国决策者提供有关未来几年的威胁和事件的情报方面,情报分析人员的竞争优势可能会减弱。但是,由于情报部门的目标是将自己与开源情报区分,它对美国政策的价值将不会来自于一个稍好一点的“美国有线新闻网” 的时事分析。虽然情报部门可以而且必须提供及时的分析,以保持与政策制定者的相关性,但情报部门的优势仍应是其经验丰富的分析人员的专业知识,以及他们能单独为政策制定者提供的分析,即他们应对全球事件的起因、前景以及对美国利益的影响和新出现的威胁有着独特和无与伦比的洞察力。当然,新技术仍将非常重要。一个掌握了人工智能和开源情报技能的情报部门分析员,能够快速了解正在发生的事情,了解秘密情报和历史背景,了解其中的原因,能对全球威胁、未来情景及其对美国政策的影响提供独到的见解。新兴技术、人类学专业知识和情报技术的结合,将使情报部门的分析人员处于独特的位置,可以解答决策者在未来几年可能提出的各种棘手的、通常以技术为导向的问题,比如:哪些是新的?随着美国的竞争对手越来越多地采用非常规的、间接的、秘密的手段来获得战略优势,分析员必须要能发现政治、准军事、信息和经济领域中新的、逐渐增加的“灰色地带”活动10。具备人工智能信号探测、模式发现和可视化工具以及敌方战略、战役和作战原则方面的专业知识的分析人员将处于最佳位置,能发现新的行动,辨别作战环境中逐渐增加的但有意义的变化,为美国政策制定者提供早期预警,降低战略意外风险。哪些是真的?随着外国虚假信息和影响活动的加速(其速度越来越快、规模越来越大、越来越复杂且看起来似乎更像真的),美国决策者将需要情报部门来协助区分“真实与虚构”。分析员将需要具备人工智能能力,比如在生成式对抗网络中检测合成的、不真实的深度造假,以及情绪分析,以衡量影响行动的因素。具有基本技术技能和国家专业知识的分析员将非常适合评估对手的信息战战略和潜在的未来行动。未来怎么做?预期战略情报不是预测具体的威胁,而是设想和正确评估潜在事件和敌对行动的可能性。基于人工智能的建模、战争推演和场景分析,可以帮助分析人员辨别和发现潜在的行动过程,预测敌决策点,以及在低概率但对美国利益影响很大的情况发生之前,发现它们的种种迹象。为当前及未来的情报分析人员赋能情报部门在战略分析中整合和利用创新技术的能力,对于产生和维持决策者的决策优势,以对抗日益复杂的敌人和竞争对手是至关重要的。为了保持分析优势,情报部门必须同时开始设想、规划和投资未来分析任务,并迅速在今天的情报技术中采纳和吸收新兴技术。将当前和未来分析需求连接在一起的将是情报分析人员自己。由于招聘名额有限、培养时间长、人员流动性低、保留率高,所以情报部门的员工不容易被具有新技术的人才所取代11。的确,正如前中央情报局首席学习官约瑟夫·加廷(Joseph Gartin)所断言的,“未来的劳动力已经在这里了”,2020年的分析人员或将成为今后的领导者、管理者,对于许多人来说,到2030年他们仍然将是分析员。情报部门领导层和重要的利益攸关方——决策者、国会、技术和研究部门——必须为这些分析人员提供技术和培训,使他们能在今天茁壮成长的同时,为未来的成功奠定数字基础、制度优势和文化规范。那么,当前应怎么做?利用开源情报在提供信息和推动分析判断方面,以及在一个大数据时代中的战略必要性方面,情报部门都必须将开源情报同传统的密悉情报一道,重新定义为一种基础情报。此外,开源情报不仅可以作为密悉情报评估的重要参考信息,而且其本身也可以作为一项分析任务。高质量的开源情报、商用地理空间情报和信号情报的结合意味着所有来源的情报分析现在都可以在非机密级别上进行。与其将其视为竞争,情报部门还不如将“成品开源情报”视为一个机会,以扩大情报的覆盖范围并对新客户和利益相关者产生影响,这些新客户和利益相关者可能会重视情报部门的情报技术和通过非机密手段获得的见解,包括国内执法、外国政府、科技和工业领域以及广大的美国公众。重视科技情报有关外国人工智能系统和科技能力、计划和意图的情报也必须作为一个基础情报任务来考虑,并进行收集和分析,这对于未来情报部门任务的规划和资源至关重要。情报部门要能了解和预测新兴技术——特别是人工智能、生物技术和量子计算——以及它们在外交政策、经济竞争力、军事和情报行动领域的应用。要做到这一点,既需要秘密收集对手的技术能力和应用,也需要关于外国科技创新(包括专利、合作伙伴关系、收购和扩张)的来源正规的开源情报。分析人员需要更多的技术和战术知识来了解国外的人工智能系统,以及他们自己的人工智能收集、定位和获取数据的能力和局限性。整合技术情报分析人员需要在数据科学和人工智能方面发展出某种程度的数字智慧,但是,与真正的技术专家合作,如数据科学家、机器学习工程师和产品设计师,则可以释放出人工智能分析的真正潜力。将数据科学家纳入到分析部门中,将有助于数据科学家理解和分析问题集,帮助分析人员理解相关的人工智能,联合构建和定制模型,将正确的工具应用到正确的数据集上,并产生出有意义的结果12。机器学习工程师和产品设计师要接触分析员的最终用户,以了解如何设计、构建和调整软件、工具和接口,以适应分析人员的独特要求。扩散零星的成就在为全系统范围内的技术采纳创建数字基础设施和制度化激励措施的同时,情报部门领导层还应授权个人主管和任务中心去获取、试验和采用适合他们独特任务需要的分析工具。某些分析任务,特别是像反恐这样更侧重于实用情报的任务,将更适合利用人工智能/机器学习。但是情报部门的领导者应该确定技术转型单位的属性、规范和最佳实践,并寻求传播经验教训,以在整个部门激励创造性方法。教育政策制定者情报分析的价值最终源于产品对政策客户的影响,以及客户对其分析质量、清晰度和解释其判断的透明度的信任。随着情报部门将人工智能和数据分析整合到其产品中,分析人员必须要能清楚而令人信服地向决策者解释这些技术是如何应用的,它们在形成评估中的相对权重,以及它们对关键判断的信心水平的影响。分析员要成为人工智能和分析应用的教育者,并学会与基于人工智能分析做出关键政策和行动决策的战略领导者建立信任。在充实和推动分析判断方面,在大数据时代的战略必要性方面,情报部门必须同传统的密悉情报一样,将开源情报重新定义为基础情报。【1】U.S.technology and cloud-provider firm research interview.【2】U.S.technology and analytics firm research interview.【3】Paul R. Dougherty and H. James Wilson, Human + Machine: Reimagining Work in the Ageof AI (Cambridge, MA: Harvard Business Review Press, 2018),【4】Joseph Gartin, “Thinking About theIC’s Talent Management Issues in an AI/ML Environment,” Elevated Debate, July8, 2020, https://elevateddebate.com/thinking-about-the-ics-talent-management-issuesin-an-ai-ml-environment/.【5】Congressional Research Service,Artificial Intelligence and National Security (Washington, D.C.: CRS); PatrickTucker, “What the CIA’s Tech Director Wants from AI,” Defense One, September 6,2017, https://www.defenseone.com/technology/2017/09/cia-technology-director-artificial-intelligence/140801/.【6】“Two neural networks are trained in tandem: one is designed to be a generative network (the forger) and the other a discriminative network (the forgerydetector). The objective is for each to train and better itself off the other,reducing the need for big labeled training data.” See National Security Commission on Artificial Intelligence, Interim Report.【7】ODNI,The AIM Initiative; CRS, Artificial Intelligence and National Security; ErikLin-Greenberg, “Allies and Artificial Intelligence,” Texas National Security Review 3, no. 2 (Spring 2020): 56-76.【8】U.S.AI security software and analytics firm research interview, interview by CSIS Intelligence and Technology Task Force, July 2020.【9】同上。【10】For more analysis on competition in the “grayzone,” see the CSIS Gray Zone Project at https://www.csis.org/grayzone.【11】Gartin,“Thinking About the IC’s Talent Management Issues.”【12】U.S.technology and analytics firm research interview.