车品觉:数据交易不是买卖沙发,他敢卖你敢买吗
过去三四年中,大数据以极快的速度从概念走入现实,深度嵌入到了经济社会中的方方面面。回望来路,大数据究竟给发展带来了哪些切实的机遇?面向未来,政府治理究竟该如何适应这一新的科技革命?
就上述问题,近日,笔者专访了大数据领域的知名专家车品觉先生。希望本次专访的内容,能够对大数据的继续发展提供讨论的火花。
车品觉先生现任中国计算机学会大数据专家委员会副主任、浙江大学管理学院客席教授等职。车品觉先生于2010年加入阿里巴巴集团,担任阿里巴巴集团副总裁、阿里巴巴集团数据委员会会长,负责阿里大数据体系的整体规划。2016年4月,车品觉先生由阿里巴巴集团去职,加入某知名投资机构,其视野也从一个大公司的内部运作转向全社会的创新创业生态体系。
本次专访内容较多,为便于微信阅读,我们分为三篇刊发,第一篇谈大数据发展的最新趋势,第二篇谈政府和企业在大数据流通中应当注意的问题,第三篇谈政府在大数据发展中应当扮演的角色。本文为第二篇。
有些政府部门没有想清楚
自己为什么要收集数据
问:
数据关联越来越多,人工智能越来越发展,势必会激发出大量创业公司的出现,大企业当然也会受益,也就是您所说的一个生态系统的形成。这显然也给政府带来了挑战,因为政府以前主要治理小数据,但是在这个大数据的生态中,政府应该做怎样的调整来刺激这个新生态的发展?
车品觉:
怎么来治理整个生态,这是一个蛮有意思的问题。中国现在有一个比较有意思的课题,就是数据资产。政府绝对是拥有数据资产最大的机构,但是今天中国对数据资产的理解太浅,有点不够重视。
有些政府部门没有想清楚自己为什么要收集数据。我认为,政府部门对数据资产停留在想要有多少就有多少的阶段。这是很小数据时代的思维:占有数据,控制数据。其实只要有好的策略,政府拿到的数据会越来越多。但是我要说的是,你拿的数据多了,对社会的责任也就多了。如果你拥有这么多数据,你又不去用,那你干吗收集?但是如果你把这些数据分享出去,人家又会说泄露隐私。
而且我们要明白,政府的数据往往是一些商业领域的催化剂,这一点非常难琢磨。事实上,你根本用不着把数据分享出去,你可以根据数据建立模型,别的公司既看不到数据,又能从你的数据里获益。这才是聪明的做法。比如人民银行征信里面的数据,是不必要公开的,它只需要做一个模型跟其他模型匹配。这一点其实是人民银行该做的。
问:
除了公开政府自己的政务数据,中国政府推出的“互联网+”战略在一定程度上推动了社会上各领域数据的关联。
车品觉:
确实是。我觉得美国这么多的总统里面,奥巴马是最伟大的。因为他是第一个把大数据推到美国国家最高战略层面的总统。奥巴马政府有自己的数据中心,有自己的政府CDO(首席数据官)。
同样做这件事情的,是我们国家的领导人。中国政府也把大数据跟“互联网+”推到国家战略层面。唯一不一样的是,美国做这个事情更加开放,中国比较封闭,但是两者的力度都非常大。我说的伟大就是在这个地方,就是敢做。你看哪有一家公司现在不赌还想赢的?国家同样如此。
当然也有人会说,与其说奥巴马厉害,不如说美国厉害。其实奥巴马之前的两任总统就已经把美国图书馆里面的资料全数字化了,这些为奥巴马的大数据化做了铺垫。但是中国政府在此之前毫无铺垫,是凭空开始做这件事情的。关于这一点,做研究的人就需要想一想,中国和美国国情有何不同?我们该怎样做?
今天的数据交易还停留在
“他要卖你要买”的状态
问:
政府开放数据,以及在全社会提倡“互联网+”,将显现地增加全社会数据互联的程度。但是在企业层面,正如您前面所说,很多数据“布点”都是别人布的,如何关联?是不是正是在这个背景下,数据交易在中国逐渐热了起来?
车品觉:
今天在中国的数据交易有一点像淘宝,就是说,如果我有一堆数据,我可以跟你做交换或者卖给你。业内有很多人交流过这个问题,但是说实话,通常情况下我是不敢用这些数据的。
为什么?你今天给我一个数据,我不知道你的来源,也不知道数据会不会是脏的,我怎么敢用?每天早上八点钟之前数据一定要给到我,你能不能做到?如果不能做到,我怎么敢用?如果用得好,下一次的数据质量是否跟上次的一样?如果不一样,我怎么敢用?另外我还担心,如果有一天你突然不卖给我了,那我已经开展的业务怎么办?
如果这些都无法确定,我是真不敢用交易来的数据。但现在的数据交易,确实是都不能确定这些问题的。总体来说,今天的数据交易还停留在“这是一个沙发,他要卖你要买”这样的状态,还没有到刚才说的细节。
不过中国的事情很奇怪,有时候先忽悠,忽悠起来了就会有很多人把他的资源加进来,结果这个事情最后也能搞成。这是很中国特色的,在美国是不敢想的,但是在中国有时候真的会发生。我朋友问我,我也不敢说中国的数据交易不行。但是我知道这件事现在还很迷茫,做这件事的官员很着急,到现在还没有一个很清楚的案例能说明,数据交易是成功的。
数据拥有权的归属是个尖锐问题
问:
一个私营公司收集的数据,本身就是用户的数据,然后再卖给别的公司,这不是有问题的吗?
车品觉:
你这个问题其实是挺尖锐的,尖锐在哪里呢?尖锐在涉及数据拥有权的归属。这个问题我们讨论了很久,政府部门也比较关心。比如说,你现在进了一个网站,这个网站说“你如果用我网站的服务,那么有关你的数据就归我所有”。你同意了,那么相当于你签了约,你使用网站或者应用的服务,网站或者应用就可以使用你的数据来改善它的设计。但问题在于,用户同意让你使用数据搞好用户体验,并没有同意你跟其他公司交换有关他的数据,是不是?
之前参加一个论坛,有个人问了数据拥有权归属的问题。旁边一位刚好在公司里做这件事情的人说,“现在来说这还不是很严重的问题”。我立马回应说:“谁说不严重?”从阿里离开之后,我就要说实话。切切实实来讲,作为一个公司你有这个权力吗?
还有一点,先不说你把数据拿出去交易,就说你自己用,譬如用户注册了一个公司的网站,使用这个网站的服务。但是这个网站仅仅靠本网站的数据对用户的认知还不足够,它出去买一点数据匹配进来,就能知道更全面的信息。但是,用户有没有授权网站去认知他?这个事情应不应该告知用户,公司有没有责任?我对这种做法有一些反感。如果在美国、欧洲的话,这个事情是有一点夸张了。我这是实话实说,没有夸大。
其实大公司在这方面的问题更大。比如腾讯、阿里,事实上是一个包含非常多公司在里面的公司,政府对这种公司的处理是不是应该一视同仁?什么意思呢?我这个公司有一百个分公司,用户和任何一个公司签“可以使用数据作为服务改善”协议时,该协议是限定在这个分公司,而不是一整个集团!我想说的是,当一家公司已经大到分公司之间的数据传输也会让你恼火的时候,你不能把一家公司当一家公司看。
大公司在使用数据时应该有限制
问:
中国的BAT(百度、阿里巴巴、腾讯)收购了很多公司,收集的数据越来越庞大。所以大公司在数据的交易中是不是应该承担更重要的责任?
车品觉:
我想说,大公司在使用数据时应该有一个限制,哪怕是公司内部的自我交换,也应该是有一个限制。老实说,今天给你讲的东西,如果我是在一个大公司工作的话就不会跟你讲,这完全违反了公司利益。但是如果从国家的立场和人民的利益来讲,这个问题还是应该提出的。过大的权力或者是过大覆盖面的公司,它们对数据的使用和小公司完全不一样,不能一概而论。
在美国这个问题已经在寻求解决方案了,不同级别的公司对数据的使用需要遵循具体的监管要求。政府已经开始对这种公司进行监管,这个监管看上去还是很简单的:就问你几句话,你们公司到底有没有合规。很多公司都有一个合规部门,是公司里面一个专门负责检查自己公司数据应用情况的部门,它会按照政府的规则去自我检查。
所以政府的监管很简单,我只找你公司的CTO(首席技术官),给你一张表填,你自己检查自己合规不合规,如果将来出了事,你等着罚。我不查你,你自查,但是一旦出了问题别怪我罚你。当然这要看企业的级别,看企业的影响级别。
问:
在中国是不是可以照搬这种做法?
车品觉:
我们现在的政府总是怕,害怕影响企业,担心监管会影响企业的运作。政府部门有这样的态度是挺好的,但是过于谨慎。我觉得这个怕不代表可以完全不做。
我说政府这样不对的原因就是,没事的时候不敢干,有事的时候太严格。你没有给企业一个比较清晰的指引,等到出事了,政府才告诉你这不能搞那不能搞,然后十几个部门一起盯着。这是一下子天堂一下子地狱。我觉得这是政府要思考的。
我最近参加了一个美国的会议。会议用的概念不叫合规,叫企业责任,往前更进了一步,就是有大量数据的公司,要先定义你的责任。这蛮有意思的,很多国家,譬如加拿大,已经开始考虑这件事了。
问:
这个会议是谁主办的?
车品觉:
美国一个很大的民间团体,是由全美国大部分数据公司共同成立的一个民间机构。这个民间机构会定期组织讨论,定下规矩然后告知政府。一旦某一个企业不遵守,就会把它从团体中踢出去。这还是蛮有意思的。但是我觉得中国的协会都不是这样的,它们做不了这样的事。所以我觉得,中国政府还是需要多做一点事。
作者为上海市科学学研究所副研究员。文章为作者独立观点,不代表主办机构立场。
◆ ◆ ◆