基于大数据的态势感知运用分析及对策建议
本文刊登于《卫星与网络》10月号
在竞争对抗中,有效感知和掌握综合态势,是己方进行战略决策的重要依据,也是战胜对方、夺取胜利的重要基础。随着信息科技的飞速发展,信息数量爆炸式增长,大数据技术应运而生,在获取感知有关方面战略态势上发挥了重要作用。对科技原理和作用机理的准确把握,发现并解决其存在的有关问题,对于进一步提高基于大数据技术的战略态势感知的准确性和效能具有重要的促进作用。
《孙子兵法》中指出,“故明君贤将,所以动而胜人,成功出于众者,先知也。”可见,只有及时、准确、全面地掌握信息,才能把握主动、取得全胜。大数据技术的产生和运用,为“知”提供了有力的工具,为有效掌握态势情况创造了良好条件。
信息技术高速发展,人类已经进入了一个充斥着海量数据的时代,大数据正是这个时代的产物。大数据具有体量巨大、类型繁多、价值密度低、处理速度要求高等4个典型特点,面对仍在爆炸式增长、足以“淹没”一切现有处理设备的巨量数据,人们已经逐渐发觉其重要作用和对其加以利用的方法。在“梅特卡夫定律”的作用下,信息网络节点越多,价值和发挥的作用越大;数据体量越大,能够造成效果也就越大。当数据增长到巨量的规模时,其将产生复杂或混沌的现象,虽然价值密度很低,但是通过特定的理论和方法,深入分析数据之间的联系,也能够通过大数据感知到更多不易被发现的规律和情况。
特别是,当今社会万物互联成为一种趋势,人与人通过网络彼此相连,各种经济、工业、交通设施通过有线或无线网络连接并交换数据,全球交汇信息数据的数量“聚沙成塔”,所有人的想法和行动几乎都映射在虚拟的数据世界中。通过尽可能多地占有数据,分析、关联、还原大数据中的信息,也就能够识别并提取有关逻辑和关系,拓展人类的感知,并能持续跟踪、信息补充、趋势预测,并为进一步的决策和采取行动提供支持。
本文所指的态势可分为广义和狭义两类,其中,广义的态势,一般指一个国家(地区)在政治、外交、军事、文化等方面表现出的战略状态或动向,以及在双方或多方互动中所处的相对位势;狭义的态势,主要指军队所占地理位置、兵力对比、战备情况等对当前和尔后行动是否有利,战略主动权是否掌握等。对态势的感知,即运用各种手段对对方各个方面战略情况及动向的发觉和掌握,是国家或军队高度关注的重点,也是国家制定大政方针、维护自身安全和发展利益的重要保障。
随着全球化进程不断加快,国际之间交往日益增多,对了解掌握其他国家有关情况的需求已经大大超越的传统情报工作的范畴,延伸到政治、外交、军事、经济、科技、文化,甚至是社会民生、意识形态等领域。在这一情况下,态势感知对大数据技术提出了旺盛的需求。在军事领域,人们普遍认为,优质的信息有利于冲破“战争迷雾”,而优质信息是由数据量及其可靠性决定的。
正如克劳塞维茨所分析的:“战争中得到的情报,很大一部分是互相矛盾的,更多的是假的,绝大部分是相当不确实的。这就要求军官具有一定的辨别能力,这种能力只有通过对事物和人的认识和判断才能得到。”面对现代战争中越来越多的信息,如果不能有效提取优质信息,去除其中夹杂着的大量“信息糟粕”,就可能陷入“信息误区”,从而处于信息劣势地位,无法取得战争的主动权。而大数据技术就是从复杂信息中发现关联性、揭示隐蔽性、增强可信性的一门科学,它能够有效弥补人力在信息处理方面的不足,因此在战略态势感知方面越来越需要大数据技术的参与和支持。
当前,世界各国将态势感知的着眼点落到政治、国防、经济、反恐等多个领域,对于感知的广度和精度有了更高的要求。《孙子兵法》道,“多算胜,少算不胜。”决定能否“多算”的重要因素在于掌握数据的多少,以及对数据处理能力的高低。大数据技术逐步应用于各领域的态势感知,将通过各种渠道搜集到的各种信息数据进行自动分类、整理、分析,有效解决现有情报、监视、侦察系统不足等问题,获取信息优势,并提高国家安全保障水平。
从技术上来看,斯诺登事件曝光的美国网络监听系统就是一个典型的大数据技术运用案例。美国利用其网络控制权,直接进入国际网络公司的中心服务器挖掘数据,搜集网络空间的各种信息数据。其中,“棱镜”项目针对的是网络数据,“主干道”项目针对的是电话信息,“核子”、“码头”、“上游”等项目则涉及通话内容、网络元数据以及海底光缆通信的监听。美国的监听对象上至其他国家的元首,下至黎民百姓,通过大数据技术从获取的海量数据中挖掘提取重要的情报信息,包括军事部署、经济动态、科技发展等多个方面,有力地提升了美国的战略态势感知能力。
在军事领域,由于不同军事目标之间或军事目标与社会要素有一定的联系和交互,这就为运用大数据技术进行关联性分析提供了可能。除了从公开渠道获取的各类社会信息中提取军事情报,还可以利用地理影像、电磁频谱等方面的海量数据,提取出军事活动情况。如,现代战场弥漫着承载各种信号的电磁波,这些信号暗含着各种作战单元之间的复杂关系,即便是在加密条件下,不通过分析信号内容,仅凭对信号个性化特征和相互通联关系,也可以在海量数据的分析中,获取有关军事目标部署位置、活动情况及相互关系。因此,大数据技术在信息化、网络化飞速发展的条件下,对态势感知能力的提升发挥了非常重要的作用。
二、大数据技术在态势感知
运用中的弱点分析
人们在看到大数据技术在提升态势感知能力的同时,也应看到其存在的问题,有些问题可能迟滞对态势的感知,有些问题甚至会导致误判的产生,这些都需要在运用大数据技术时引起高度的重视。
当前,信息技术仍在快速发展,带来的影响是高性能通信手段的广泛普及和信息量的进一步暴增,全球各类数据呈指数级、非线性增长到PB为单位的巨量规模。在这种情况下,协调好空间、时间和能力之间的关系尤为重要,在大数据处理方面,需要空间足够宽广、时间足够压缩、能力足够强大,也就是要求以足够强大的能力解决两个重要问题——数据采集传输问题和数据分析问题;满足两个重要需求——领域宽、地域广的需要和时间紧、精度高的需要。而针对战略态势感知,其大数据之“大”,给采集传输和处理分发都带来了严峻挑战。
美国政府早在2012年就发布了《大数据研发倡议》,同时公布了所有的研发计划,大数据技术研发和运用不断推进,但在实际运行中,面对来自网络、太空、空中、地面、水下等多领域数据采集系统传来的结构化或非结构化的巨量数据,同样面临各种系统不断饱和、通信线路带宽不足、分发运用难以及时的困境。有些领域虽然引入了大数据技术,但人力参与仍不可缺少,如美军一架“捕食者”无人侦察机在阿富汗一天所搜集的影像数据达到50000GB以上,在运用技术处理的同时,仍需要19名情报分析人员参与。这些凸显出大数据技术在战略态势感知运用中,数据处理和分发仍是亟待解决的瓶颈问题。
伪装欺骗是态势感知的最大敌人,即便是信息化条件下,有意而为之的伪装欺骗仍会给基于大数据技术的态势感知造成误判。而且针对大数据技术的特点,有针对性地在一些关键信息上进行掩盖,或者通过民众的力量将虚假信息进行放大,那么真实信息将被数据洪流所淹没,从而达成欺骗的目的。
1944年6月盟军实施诺曼底登陆前实施的战略欺骗就是典型案例,尽管德国严密监视海峡对面的盟军动向,并派遣大量情报人员严密搜集盟军的部署情况,相当于构建了一个对盟军态势的“大数据感知网”。然而盟军在部队调动、无线电通联、物资储备、军队将领任用、军民交往互动等方面实施了全面的欺骗,制造了种种假象,甚至故意传递一些虚假情报。这些数据汇总处理后,使德军得出了盟军登陆作战准备还未完成、主攻方向是加莱等错误判断,从而减轻了诺曼底登陆部队的作战压力,使盟军成功开辟了欧洲大陆的第二战场。
类似的案例也发生在第四次中东战争期间,尽管以色列布置了严密的情报侦察系统,但埃及和叙利亚为了达成战争的突然性,实施了各种伪装和欺骗。埃及在战前半年中对预备役人员多次进行征召尔后复原,架桥器材反复运抵和撤离运河,部队经常前调和后撤。在开战当天,埃及政府还组织各国驻埃及大使到各地参观,宣布一批高级军官到沙特“朝圣”。埃及和叙利亚这种周密的伪装和欺骗措施共计二百余项,使得以色列对战略态势的感知产生很大偏差,以至于以色列军队在突然的开战中遭受了沉重的打击。
信息时代,大数据技术在采取和处理数据的过程中,往往是以大量的数据为支撑,而如果是有意识地提供大量与实际情况相反的数据,很可能会成功欺骗大数据感知系统;抑或是少量的真实情况,淹没在大量的伪装数据之中,同样难以准确辨识出来。因此,需要人的能动参与,以及把握住关键手段或细节,才能有效提升态势感知的准确度。
数据分析算法的科学性对大数据处理来说至关重要,其直接影响所得结论的准确性。对于战略态势感知来说,需要有针对性地运用不同的算法,对特定事件出现的各种征兆或迹象进行采集、质疑、假设、数据补充、验证和评价,这一过程往往需要重复循环进行并不断修正,以提高结论的准确性。然而有关算法的逻辑基础大多是基于人的判断,虽然人的判断在后续会得到修正,但是如果一开始方向就是错误的,得到的结论可能会距离真相越来越远。
例如,二战中盟军对德国展开了大轰炸,德军防空火力猛烈,造成很多飞机被击伤击落。由于飞机载重有限,军方必须在飞机作战性能和防护效率方面取得平衡,即在最需要被保护的部位增加装甲厚度。军方提供的数据显示,返回基地的飞机上留下来的弹孔并不均匀,机翼是被击中最多的部位,而引擎和座舱则被击中的较少,因此建议在机翼部位加装装甲。美军请来了数学家瓦尔德对该结论进行论证和评估,但他给出的答案与军方的截然相反。通过数据统计和反复计算,瓦尔德提出的方案是在弹孔最少的部位,即引擎和座舱部位加装装甲,理由是:飞机各部位受到损坏的概率应是均等的,但引擎和座舱上的弹孔很少,究其原因是由于这些部位被击中的飞机大多未能返航,而是坠毁了。这就是著名的幸存者偏差理论。从数据处理的角度,军方和瓦尔德针对的统计样本是一致的,但是得到结论不同恰恰是采用的算法模型不同。
另外一个案例是,2009年谷歌启动流感预测项目,该项目能够比美国疾病控制中心提前两周预报流感的发病率,其机理就在于对大量搜索中有关流感相关关键词的统计,为美国掌握流感爆发情况、提前进行预防控制提供了有力支撑。然而在此后的5年中,该项目预测结果频频产生严重偏差,原因在于由于媒体对该事件的报道,导致人们对搜索行为发生了新的变化,从根本上说是由于运用的数据统计和处理算法只是关注了相关性关系而没有更多关注因果关系。
因此,对于战略态势感知来说,大数据处理算法更需因时、因势、因事而定,片面的或者僵化的算法都将产生严重的误差,而人为因素的全程介入,则又将造成一定的主观性,二者的矛盾需要很好地协调解决,才能切实增强感知的有效性。
善用数据者制人,不善用者制于人。围绕国家和军队的战略需求,利用大数据技术有针对性地进行态势感知,越来越具有重要的意义。美国有一句流传颇广的名言:“除了上帝,任何人都必须用数据说话”。这句话虽然过于绝对,但也反映了一种潮流和趋势。未来国与国之间竞争对抗的一个重要方面在于数据,数据的获取能力、处理能力和支撑决策能力将是获得比较优势的关键。发挥好大数据技术优势,同时修正其存在的问题,将会有效提高战略态势感知能力,并为战略决策提供强有力的支撑。
基于大数据技术的态势感知是一项事关国家安全和发展利益的系统工程,需要加强顶层设计和宏观谋划,依托国家力量稳步推进。由于态势感知涉及安全领域多、政府部门多、手段技术多,因此应加快协调合作机制建设,促进相关工作的对口衔接和密切配合。在探索并成熟有关政策机制的基础上,应推进立法建设,保障工作的稳定和长远发展。
加大投入力度,促进基础设施、手段、力量等方面的建设,着力解决数据采集、传输、处理和分发问题,最大限度地利用全球数据资源,根据我国数据处理能力,构建相应的数据处理模式,努力在数据获取、计算、传输等方面形成平衡,发挥整体的最大效益。国外有关做法可供我们借鉴,但最重要的是结合我国实际,走出一条具有我国特色的发展道路。
抓住时代机遇,牢牢把握开发利用海量数据的主动权,是发展基于大数据技术的态势感知能力的基本着眼点和落脚点。但是在当前的形势下,单纯利用大数据技术来感知战略态势,还存在很多不成熟、不确定的地方。尽管大数据技术的发展已经取得了极大的进步,但我们也应看到其局限性,大数据技术在很多方面无法完全取代人类的智慧和判断。因此,在进行态势感知过程中,需要注重人的参与,特别是相关领域专业人士的参与,更好地将人类的智慧、经验、知识与科技装备的高速运算、海量存储、光速传输相融合,从而产生更加准确的态势感知结果。
大数据中大多是非结构化的数据,要想及时捕捉、存储、聚合和管理这些数据,以及对数据进行深度分析和挖掘,需要强有力的技术能力。尽管美国等西方国家在大数据处理软件平台和相关产业方面已经初具规模,但是由于应用领域和模式的不断拓展,大数据技术仍处于快速发展变化之中。
在利用云计算、高性能计算、人工智能技术处理海量数据,进行态势感知方面,我国既有机遇,又有潜力,需要加强科技创新,努力在关键技术上求突破,以技术创新推动态势感知能力的快速提升。在发展路径方面,应大力推进军民融合,充分利用社会科研资源和力量,争取在创新成果和产业规模上形成跃升,为利用大数据技术辅助战略决策、支持战略行动方面提供有力支撑。