论大数据的供给侧改革

编者按

供给侧改革是2016年我国经济领域的一个热词。在大数据领域,作为海量数据拥有方和产出方,也存在一个供给侧改革的问题。2017年,以开放、连接和价值为核心的技术发展和政策,将为整个大数据行业发展推波助澜。

如果想要理解当前的热门技术趋势,很多人都知道,Gartner每年都会发表一个著名的技术成熟度曲线图,大数据行业从2011开始出现,到2013年达到顶峰,2015年从曲线上消失了。

2014年Gartner技术成熟度曲线图

这一改变表明了,对大数据概念的炒作已经进入了尾声,大数据已经融入到了各行各业中,人们更加关注数据如何结合应用场景产生实际价值。

1、大数据供给方 – 数据源的现状

大数据如果要产生实际的价值,不可避免就是数据源。来自各行各业形形色色的数据供给方支撑着大数据的发展。当前大数据的数据资源主要有三个来源:

政府:从数据规模上讲,政府仍然是当前拥有数据资源最为广泛的机构。虽然政府一直在鼓励数据公开,但是大量的政府数据存在不少问题,很多政府部门不知道数据在哪里,数据能不能开放,政府部门愿不愿意开放,数据好不好,大量数据没有程序接口支持,静态数据居多,数据按承诺更新比例低等等。北京、上海、浙江等是目前国内政府数据开放总体水平相对高的省市。

表1  部分政府数据开放资源

l BAT:中国互联网三巨头各自拥有的大数据早已是重中之重的核心部门,但是对外输出能力和开发层级,却有不同的特征。阿里巴巴是在2015年开始尝试推动大数据价值输出,也在2016年1月的云栖大会上海峰会中正式宣布开放大数据,发布“数加”大数据平台。但在“数加”平台发布之后,阿里巴巴的大数据价值输出政策却180度大转向,开始逐步限制使用其内部大数据。与阿里巴巴相反,百度的大数据政策从2015年的相对封闭,到2016年开始更加的开放,即提供有关的商业数据程序接口合作,也可以进行数据互换等相关合作。腾讯则是三巨头中最稳定的,一直没有比较官方的大数据价值输出平台,2016年略有进步,但是仍然是最不开放的一个。

l 运营商:如果说在2015年,想要使用运营商数据,基本上还没有任何合法的出口。2016年开始,最早从各个省分公司,到下半年的集团公司,均已经将大数据提升到了另外一个战略高度。目前电信运营商已经将大数据作为核心业务的一个部分来开张。电信,联通早已经在数年前就开始布局集团数据集约化,相关的大数据服务公司和部门,在2016年的业绩均已达到亿元级别。

2、大数据的“供给侧改革”

大数据的供给侧,也就是各种类型的数据源,其兴起的时间从2013年大数据元年到目前,在这短短的4年时间里,数据源经历日新月异的快速发展。从大数据供给侧改革的角度,笔者总结为3个关键词:开放、连接、价值

l 开放:无论现在和未来,开放是所有的数据供给方不断调整的过程。由于数据往往是不区分行业的,数据可以在各个行业产生价值,如果要让数据在其他行业中产生价值,就必然涉及到数据开放。从数据需求方的角度,往往越是能够接触底层数据,越是能够挖掘出数据的价值。然而,从保护数据安全及隐私的角度,数据供给方往往不会开放底层的数据。这里还需要数据供给方和数据需求方不断地探讨合适的开放规则和手段,以保证双方的要求都能得到满足。政府方面,早在2015年10月,发改委表示2018年将建成政府数据统一开放门户。也已经有不少省市,为了规划和协调政府的数据资源开放,而专门成立了政府专属职能部门– 大数据管理局。

表2  当前政府大数据管理局

从2016年开始,BAT和运营商都开始规划专属的大数据部门和数据平台合作部门,制定数据输出标准和数据输出内容,有更加前沿一些的数据供给方,例如北京移动,2017年开始邀请不同行业的合作伙伴共同基于运营商数据打造行业服务产品。

l 连接:数据供给方逐步开放有价值的数据资源基础,马上面临的第二个问题就是数据连接打通。从事数据行业的人士都明白,孤立的数据价值是有限的,只有融合的数据才有价值。存在的最大问题,是通过什么样的标准打通数据,或者说通过什么样的标识ID,可以做到多方数据关联。不同的业务系统,保存的标识ID也是千差万别,例如一个用户的身份证号、手机号、邮箱号、社交媒体账号等,都可以作为一个用户的身份标识。而不同的数据业务系统,不同的ID标识维度,以及不同数据完整度,都会极大地影响数据打通效果。结合上文中提及的政府、BAT和运营商三大供给方,当前手机号以及手机设备码IMEI等,更具有统一打通数据标识ID的可行性。这同时也带来另外一个新的问题,在数据的打通形式上,由于标识ID对很多的数据供给方而言是一个隐私核心字段,很难作为数据交换的字段开放。因此要做好数据连接和打通,即大家都需要在一个公平公正、不保存和窃取各方数据、同时保证多方的数据安全的环境里,进行数据打通。这个就需要有一个多方互信的地方(例如政府中立的角色),双方在这里进行数据互换,各取所需。当前各个地方政府成立的相关交易市场,或可以承担这个角色。

表3   2016年成立的大数据交易中心

l 价值:大数据要逐步向行业靠近,大数据要结合行业具体场景解决具体问题。这就需要大数据供给方转换角色,不以自身拥有海量数据而自居,不再抱着总是数据资源卖得太便宜的心理(某些数据供给方的起步合作价格都以百万元作为起始合作价格),而是与行业应用开发合作伙伴一起深入探讨在行业中的应用场景,基于应用场景与合作伙伴共同打造行业大数据应用产品。合作方式上,鼓励合作分成的形式,降低行业应用前期合作成本,打造更加具有活力的行业大数据应用生态。

3、结语

2016年大数据行业的供给侧改革才刚刚开始,2017年,以开放、连接和价值为核心的技术发展和政策,将在数据供给方发生非常快速的推进和变化,同时也对整个大数据行业的发展起到巨大的推动作用。

作者简介

周像金,2011年担任甲骨文大数据平台存储归档大中华区系统架构师,带领团队实现了甲骨文第一款大数据平台存储归档系统。2012联合创办北京微瑞思创信息科技股份有限公司,担任公司CTO。

责任编辑:刘小玲

(0)

相关推荐