大数据驱动创新再升级——解读美国《联邦大数据研发战略计划》
2016年5月,美国政府发布了《联邦大数据研发战略计划》,以加速其2012年提出的“大数据研发行动”进程。本文对该计划进行了解读,供读者参阅。
2016年5月23日,美国政府发布了《联邦大数据研发战略计划》(The Federal Big Data Research and Development Strategic Plan,以下简称《计划》),以加速其2012年提出的“大数据研发行动”进程。《计划》旨在构建数据驱动战略体系,基于大数据的分析、信息提取以及做出决策和发现的能力将激发联邦机构和整个国家的新潜能,加速科学发现和创新进程,并培育21世纪下一代科学家和工程师,促进经济增长。《计划》由7大战略组成,涉及15个联邦机构,对各联邦部门制定与大数据相关的计划和投资提出了指导意见。
《计划》是《大数据研发行动》的延续
美国政府将数据定义为“未来的新石油”,认为一个国家拥有数据的规模、活性及解释运用的能力将成为综合国力的重要组成部分,21世纪数据将成为下一个大的战略资源。政府机构的相关研究、公私伙伴关系以及未来数据科学家的教育和培训,将大大促进数据的应用,促进经济社会的发展,改善人们的生活质量,提高综合国力。《计划》是《大数据研发行动》的补充和完善。2012年3月29日美国政府发布全球首个国家层面的大数据战略——《大数据研发行动》(以下简称《行动》),大力推动和改善与大数据相关的收集、组织和分析工具及技术。《计划》则是由7个平行的战略组成,涵盖了技术、可信数据、基础设施、共享管理、隐私安全、人才培养和协作等与大数据研发相关的7个方面,通过比较可知,《计划》是对《行动》的补充和完善(表1)。
表1 《行动》与《计划》内容比较
资料来源:作者整理
《计划》的特点
战略意志,《计划》的内容和布局体现了战略性。美国大数据战略得到政府科研管理体制和预算机制的支撑,《计划》报告发布者为“网络和信息技术研究开发计划”(The Networking and Information Technology Research and Development(NITRD) Program)[注]。2011年,NITRD成立了大数据研发高级指导小组(Big Data SSG)。2012-2015年的4年间,Big Data SSG作为美国大数据战略的“司令部”,在政策制定、执行和宣传方面做了大量的工作。在与Big Data SSG近4年的年度战略重点对比分析后,可以发现《计划》所提及的5个战略都是Big Data SSG的年度战略重点(表2)。
表2 Big Data SSG近4年年度战略重点与《计划》的5个战略比较
资料来源:作者整理
Big Data SSG未涉及的战略4(共享管理)和战略5(隐私安全)则与美国政府另外两个政策——“开放数据”和“隐私保护”的研究有一定联系(表3)。因此,《计划》中的7大战略都有据可循,逐渐融合成一个完整的有机体。
表3 战略4和战略5相关的政策文件
资料来源:作者整理
2015年,NITRD做出重大调整:在维持原有的8个项目组件领域(PCAs)的基础上,经过整合和补充形成了10个新的项目组件领域。其中,新组建的大规模数据管理和分析(LSDMA),即由原来的Big Data SSG与人机交互和信息管理(HCI&M)领域中的信息化研究合并而成,总体负责联邦大数据研发工作的协调和管理。
前瞻布局,不断加大对基础研究和前沿技术的研发投入力度。通过分析各机构的预算分配,可以发现政府协调下资源配置的实际倾向。NITRD最新年度报告显示,LSDMA领域的预算分配给了8个联邦机构,总投入接近3亿美元。其中,国防部先进研究项目局(DARPA)和国家科学基金(NSF)的预算金额占比最大(表4)。
表4 联邦各机构预算分配(LSDMA领域)
资料来源:作者整理
协同发展,重视跨机构协作,保证《计划》的顺利实施。随着战略布局的循序渐进,为避免《计划》沦为一纸空文,联邦政府在实践中特别重视跨机构的协作。
一方面,各联邦机构分别承担相应的大数据项目。联邦机构公开的大数据项目在一定程度上反映了战略的实施情况。LSDMA列出了各联邦机构大数据研发的部分项目,这些项目、涉及的机构以及对应的战略(表5)。
表5 联邦各机构的大数据项目及其对应的战略
资料来源:作者整理
另一方面,联邦机构积极开展与非政府机构的协作。从《计划》的战略7中,可以看到联邦机构积极开展与非政府机构的协作。如NASA、NSF、DOE与Top Coder公司合作运营的一系列围绕数据融合的思维挑战赛;NASA与Amazon合作提供NASA地球数据交换平台(NASA Earth Exchange)的访问;国家海洋和大气管理局(NOAA)与Amazon、IBM、开放云联盟合作并向公众发布所有的NOAA数据;DOE采用了全球协作模式对大型强子对撞机实验和模拟数据进行共享和分析。
几点启示
美国大数据战略布局早、投入大、涉及面广,不仅在规划内容上走在世界的前列,在布局及实施上更是领先全球。
注重通过构建数据驱动战略体系,提高其国家及城市的竞争力。美国大数据战略的首要目标是提高竞争力。基于此目标,《计划》在顶层设计中不仅包含了提升计算能力及大数据技术和应用的创新战略,还包含了提高数据可信度、加强基础设施建设、开放数据、保护隐私、人才培养和跨机构协作等支撑性的内容。因此,美国大数据战略的“野心”不仅仅局限于大数据科研本身,而是构建一个数据驱动战略体系,将大数据研发作为“原料”,其他要素作为“催化剂”,以提高整个社会的“产出”,从而提高整个国家及城市的竞争力。
大数据战略需要持续地跟进和不断完善。《计划》是对以往大数据相关政策的延续和完善。在正式政策发布之前,美国已经在数据科学领域进行了科研布局。在《行动》发布后,美国更是在大数据领域加速布局,分为三条路径:一是科研创新和人才培养的政策路径;二是政府数据开放的政策路径;三是个人隐私保护和数据安全的政策路径。这三条路径最终汇聚到了最新的《计划》之中,形成一个全面且具有针对性的战略。这种战略的可持续性既保持了政策的稳定,又符合客观发展规律,使美国有能力引领大数据领域健康持续发展。
跨机构协作对大数据战略的顺利实施具有重要作用。联邦政府大部分机构都有自己独立的研发部门,协作可以让分散在各部门的大数据研发资源得以优化配置,形成合力实现重大关键领域的突破;也可以使原本在各部门孤立的数据重新整合,发挥出真正大数据的价值;同时还能促进不同领域的跨界交叉,促使更多新思想和新方法的产生,创造出更多的创新项目。美国大数据战略离不开政府顶层OSTP的战略指导、NITRD的组织协调和OMB的预算审核,更重要的是这些机构本身就建立在跨机构协作的目标之上。
注:“网络和信息技术研究开发计划”(NITRD)是美国政府在1991年部署的一项具有国家战略意义的研发计划,提供了一套框架和机制来整合各联邦部门资源以支持高级信息技术研发,并由项目组件领域(PCAs)和高级指导小组(SSGs)两种类型的研究活动协调方式所组成(PCAs优先级高于SSGs,PCAs相当于 “重大工程”,SSGs相当于“试点”)。NITRD由总统行政办公室EOP下属的科学与技术政策办公室OSTP管辖。
转自《科技发展研究》2016年第12期。作者曹磊、杨帆分别为上海科学技术情报研究所 战略研究部副主任、工程师,上海市科学学研究所研究实习员。文章为作者独立观点,不代表主办机构立场。
◆ ◆ ◆