大数据的下半场:谁来拨乱反正?
隐私问题也是国际数据行业一直争议不断的问题。美国联邦贸易委员会曾发文呼吁数据经纪商提高交易流程的透明度,接受公众监督。FTC表示,除非数据用于征信、就业、保险等领域外,没有法律规定数据经纪商一定要保护用户数据的隐私。
作者 | 韩涵
本文长度为2500字,建议阅读5分钟
当前,数据资源获取的困难与日益迫切的数据需求之间的矛盾仍然是阻碍大数据产业发展的主要矛盾。有效供给严重不足,大数据产业无法摆脱其“资源型产业”的帽子。大数据的快速发展及相关红利的释放落地,使得数据资源争夺愈演愈烈,数据资源已经成为大数据产业最为关注的热点,也已经成为各行业、各类机构争相获取的重要性基础资源。国内数据行业繁荣之下暗藏乱象。
(一)生产环节:企业争相垄断数据资源,技术投入遭轻视
新技术新业态的发展,在前期往往会经历“野蛮发展”阶段,大数据产业也刚刚经历了其“爆发”的初期。相关企业纷纷“跑马圈地”,或凭借传统优势抢占某一应用领域的“山头”,或积极布局试图垄断某些数据资源的“入口,”产业秩序尚未完全建立。
可以说,当前大数据产业仍然是“资源型产业”,可以称之为“数据产业”。由于资源型产业门槛低、利润高,新兴的大数据企业往往首先将目光盯在获取数据资源上面。2016年1月至2016年10月底,中国大数据行业有184家企业获得投融资,占有数据资源的情况是投资界对大数据公司估值的最重要依据[1]。
大量依托数据资源优势的企业诞生,为大数据产业带来了低附加值的垄断经济模式,使得依靠技术壁垒打江山的企业不得不面对残酷的市场竞争,放缓了技术研发的步伐。以当前非常活跃的大数据征信市场为例,当前市场上与“征信服务”相关的公司有2000家左右,目前有资质的征信机构占整个征信市场的比例还不到5%[2]。无牌照、无约束甚至非法的机构和个人,正在倒买倒卖大量信息以牟取暴利,对正规征信机构造成了“劣币驱逐良币”的恶性后果。
按照我国惯例,资源型行业往往以国家特许经营的形式规范市场,而数据行业由于缺乏国家层面的统筹规划,缺乏在生产环节解决数据权属等核心问题的规则和制度,繁荣之下暗藏乱象。只有在数据资源层面形成统一的行业共识和行为规范,才能弱化垄断资源所带来的不公平竞争,引导产业走向以技术为导向、以应用为导向的良性发展模式,提升我国大数据产业的长久生命力和国际竞争力。
(二)流通环节:非法数据交易猖獗,隐私保护遭到严重挑战
2013 年,中国大数据交易产业从中关村正式引爆,经过了近三年的发展,如今中国数据交易流通的产业链不但已经初步形成,更是在全国各地、各行各业开花,数据交易流通产业规模逼近百亿产值。百度、腾讯、阿里、京东等互联网巨头纷纷切入数据交易和数据服务市场,启动了百度API、腾讯云、阿里云、京东万象等大型数据交易和数据服务平台,已经汇集的数据供应商超过500 余家,数据交易流通超过每天百亿次。
聚合数据、数据堂等众多新兴的数据交易流通、数据挖掘应用公司,不但实现了数据收入突破亿元的快速增长,在资本市场上也获得了数十亿元估值的资本青睐。北京、贵州、河北、上海、武汉等超过15家地方政府,建立了政府数据开放、数据资产管理、本地数据流通为目标的区域数据交易市场,而未纳入公开市场的数据流通,更是体量巨大,整个数据流通产业如火如荼。
随着数据交易平台的大量涌现和数据流通交易产业的变现模式为全社会所认知,在利益诱导和监管缺失的情况下,大数据的流通交易面临的问题也愈发凸显:数据侵权、数据窃取、非法数据使用、非法数据买卖已成为行业乱象,并呈现失控态势。大数据的流通交易中的这些问题不仅仅严重损害了国家安全、企业合法利益、个人隐私、数据价值挖掘等方面,更在实质上阻碍了大数据产业的整体发展。
2015 年以来,电信诈骗、数据泄漏、非法倒卖案件频发,个人身份信息等用户数据的泄露,使得违法人员能够使用大数据实现精准诈骗;微博数据、各类论坛数据等被非法获取导致用户社交关系泄露;企业积累数据被二次倒卖致使经济利益受损。例如:今年8月,山东考生徐玉玉因为隐私泄露导致被诈骗后身亡的事情在社会上引起了广泛影响;今年12月,“京东12GB用户数据泄漏”事件,包括用户名、密码、邮箱、QQ号、电话号码、身份证等多个维度、数千万条数据被倒卖,震惊互联网界,引发社会对于信息安全的紧张情绪剧增。
如何对流通的数据构建监管、追溯、标识体系,建立行业秩序和标准化行为模式,从而打击非法数据流通,保护企业、个人利益,维护行业健康发展,已经迫在眉睫。
(三)应用环节:数据“变现”急迫,部分机构陷入“数据共享陷阱”
当前大数据行业的应用市场呈现政府牵头的明显趋势,各级政府部门、公安、交通、铁路、金融等各行业龙头机构对数据开放、共享、应用的日益重视,逐渐形成了中国特色的大数据应用市场。由于政府各部门各自主导的信息系统设计上对开放共享考虑不足,加上部门管理体制原因,信息孤岛、数据壁垒现象普遍。当前亟需破除相互割裂的局面,通过数据信息深度融合避免产生条块分割和烟囱林立。
然而,大数据、信息化项目普遍存在涉及部门多、推进难度大、“一把手工程”现象,同时项目周期长、投资规模大、直接经济效益不显著,使得政府部门更倾向于追求短期效果而非长期利益。突出表现为重点上马“大系统”项目、搭建“大屏幕”展示、依托外部数据资源建设内部应用以及先搞应用后汇聚数据等做法,使得大数据项目建设如火如荼,核心政府数据资源的汇聚却没有真正实现,大量机房机柜严重赋闲。
另一方面,在有些政府企业PPP(Public-Private Partnership)合作模式中,由于没有约定合理的数据资产归属权和政府资本退出机制,导致政府重要数据资源过早变现或廉价变现,国有资产流失到社会,公共数据资源没有经过高技术高附加值的处理而野蛮开放。
政府及行业客户对大数据需求的增长,对大数据产业发展是重要的历史机遇。但是由于数据应用层面的开放共享目录、数据使用规则等核心问题没有统一规范,数据资源的封闭与过度开发现象并存,一方面使得部分机构陷入大数据项目没有真正有效利用数据的“数据共享陷阱”;另一方面,为了筹措项目资金,政府高融资、高负债、高担保现象严重,一但项目实际应用效果不佳,容易诱发政府债务危机等问题。
关于“拨乱反正”的思索
在法律、制度、标准等发展滞后于产业增长速度的现状下,鼓励正当、合法、规范化的数据资源生产、流通、应用机制,打破资源垄断,淘汰地下数据黑市,快速建立健康的行业秩序,才是保证所有玩家不离场的基础,才是延续下半场产业持续繁荣的基石。
— 关于作者 —
韩涵
中国信息通信研究院 高级工程师
大数据发展促进委员会 办公室主任
“大数据流通与交易国家工程实验室-大数据流通合规性评估研究中心”主任
注:本文由 韩涵 投稿数据猿发布。