车品觉:我们正站在大数据带来的整个创新生态的临界点

过去三四年中,大数据以极快的速度从概念走入现实,深度嵌入到了经济社会中的方方面面。回望来路,大数据究竟给发展带来了哪些切实的机遇?面向未来,政府治理究竟该如何适应这一新的科技革命?

就上述问题,近日,笔者专访了大数据领域的知名专家车品觉先生。希望本次专访的内容,能够对大数据的继续发展提供讨论的火花。

车品觉先生现任中国计算机学会大数据专家委员会副主任、浙江大学管理学院客席教授等职。车品觉先生于2010年加入阿里巴巴集团,担任阿里巴巴集团副总裁、阿里巴巴集团数据委员会会长,负责阿里大数据体系的整体规划。2016年4月,车品觉先生由阿里巴巴集团去职,加入某知名投资机构,其视野也从一个大公司的内部运作转向全社会的创新创业生态体系。

本次专访内容较多,为便于微信阅读,我们分为三篇刊发,第一篇谈大数据发展的最新趋势,第二篇谈政府和企业在大数据流通中应当注意的问题,第三篇谈政府在大数据发展中应当扮演的角色。本文为第一篇。

1

大数据是一种全新的材料,

不是另外一种高科技

问:

大数据在三四年前爆发,成为经济社会各领域广泛接受的新概念。您在大数据领域有着丰富的实战经验,但是以您观察,社会层面对大数据是不是已经广泛接受?

车品觉:

今天你跟我聊,我特别想强调的一个观点,就是大数据是一种全新的材料,它不是另外一种高科技,只要你找到了合适的方式用它,它在哪里都可以使用。这个观点看似被人重复过很多了,但是其实很多还根本不理解。

我跟很多企业领导或者政府部门谈大数据的时候,发现他们很多都是停留在“解决问题”的层面,就是说,当大数据引发一件事情后,他们总是在想该怎么解决,但是很少认真探讨这个出来的事情,本质上跟以往的东西有什么不一样。因为你真的把大数据当成是一种材料的话,你就会明白,大数据带来的问题是全方位的。它不是哪一种具体的技术,让你能看到它的功能,让你有办法针对性地管理。大数据带来的影响是全方位的,很多创新出来的时候,你根本意识不到,同样很多问题出来的时候,你也完全理解不了。所以我说,一定要把它当做一种新材料,从本质上,从体系上来思考大数据。

2

大数据时代,最重要的是关联

问:

大数据对经济社会的方方面面都有渗透,刚才您谈到了大数据本质上是一种材料,那么,从您这些年的体会来看,对这种材料的应用,相较于以前的数据应用,究竟有什么样的新特征?

车品觉:

如何应用大数据?首先要了解数据的生命周期。“布点”、“收集”、“存储”,这些是前端,之后需要对数据做“识别”、“关联”、“分析”。还有一个能把整个过程包起来的,就是“实时刷新”。这就是数据的生命周期,它是一个闭环。不管你怎么使用大数据,你首先要了解这个周期。

大数据跟以前的数据不一样。首先,“布点”就往往不是你自己布的,有些“布点”是别人布的,所以你需要有一个对外部数据的认知。尽管你自己的数据有时候已经足够大了,但还是要关注别人的布点,要把别人的数据“关联”在你自己的数据当中。这是跟以前最不一样的。以前的数据是封闭的,大数据时代不一样了,一定需要跟外部的数据关联。

譬如反恐,一个人从新加坡来北京,他从新加坡上飞机开始,就已经跟各种数据关联了。事实上,关联的速度越快,用于计算的时间就越多。我听说美国在“9·11”后,用了三年的时间拿到了一种非常重要的技术,一种快速计算的技术。这种技术能从你站在海关那个地方拍照开始的五分钟内,计算出你是一个恐怖分子的概率有多大。为什么?因为它用五分钟时间把你的数据和恐怖分子的数据进行了关联和计算。这只是据说,并没有人详细知道。为什么我知道,因为它用到的这个技术,刚好是我朋友那个公司开发的,这个技术本来在华尔街的交易中心用来实现一百毫秒的运算能力,有人买了这个技术给了美国政府。

就像我刚才讲的,从人脸识别到匹配全世界十几亿人数据,如果你需要三个小时来计算,那肯定就完蛋了。正确的做法是:从你进入海关的那一刻就开始计算,之后不管你是在空中还是在陆地上,计算机都在不断关联和计算你。所以说大数据时代,最重要的就是关联。

问:

如此说来,数据关联是大数据时代的新特征,那么数据关联一定能够创造之前不可能创造的新价值,是这样吗?

车品觉:

过去我们用数据去解决“发生了什么”这样的问题,但是从我们知道“发生了什么”到最终“如何解决”,中间是有很多的环节。随着数据技术的发展,中间环节需要人工判断的地方在逐渐减少。

譬如打车软件告诉你,从现在这个地方打车到你家需要45分钟,但是你因为急事必须30分钟之内回到家,怎么办?其实后来你发现,你可以先打车到某一个地铁站,在那个地铁站乘地铁,总共半个小时就到能到家了。这个问题就解决了。但此时你发现你已经必须关联第三方数据——不单单是出租车的,还要地铁的。

过去数据很集中,就是我知道我有多少数据,问题很清楚,我能解决问题。但是我告诉你,过去的解决只是一种假设的解决,因为没有第三方数据,只是基于假定的第三方数据做决策。所以大数据的起点就是关联第三方数据。当第一方数据和第三方数据能够非常有机结合的时候,我们对数据的分析就会有一种全新的理解。

3

大数据应用涉及“快”、

“准确”和“过去的经验”    

问:

所以要做出正确的决策,关联第三方数据非常重要。那从机器的角度来看,代替人决策的内容越来越多,是否意味着对技术的需求也越来越高?

车品觉:

事实上,人工智能、深度学习,这些都是二十年前就有的技术,但是二十年前没有大数据,没有可以关联的数据。所以大数据的故事从有了关联才真正开始。

正像我前面讲的,这个过程中,人类在中间环节需要做判断的地方越来越少了,这不是减少人手这么简单,其实它是“两秒钟”的科技,就是说,让很多事情的决策提高了两秒钟。不要以为两秒钟很简单,你要知道一百毫秒跟两百毫秒的差异,在股票市场中就是会死人的,人家拼就拼这一百毫秒。

问:

大数据的应用,代替了很多人的思考,加速了决策过程,“快”是大数据应用创造价值的主要判断标准吗?

车品觉:

在我看来,大数据的应用一般涉及三个问题:在解决一个问题上,“快”是不是一个非常关键的点?“准确”是不是一个非常关键的点?“过去的经验”是不是一个很关键的点?

☛ “快”,我刚才说了,很多事情,胜负就是两秒钟甚至一百毫秒的事。☛ “准确”,自动驾驶对路上的人脸识别,过去的准确率是90%,如果你能提高到95%,很多功能就可以实现了,那就是一场革命。还有就是 “过去的经验”,也就是可重复性,我从这里跳下去死不死?这是一个低概率事件,根本没有重复性,因为我只有一条命。所以我们喜欢看的是天天都有的数据,就是发生率非常高、重复率非常高的数据,这样的话,数据分析才有大用途。

4

越来越多小公司入场,大数据生态进入临界点

问:

谈到大数据带来的新价值,您之前在阿里工作,现在成为一名投资人,所以无论是自己的实践,还是您看到的其他人的实践,相信都是非常多的。我想首先了解您为什么会从一个大公司的大数据负责人转战做一名投资人。

车品觉:

对我来说现在是扩大眼光的很好的时机,可以看到更多的东西。以后有机会可以再把目光收回来聚焦。就个人来讲,我没有兴趣帮企业赚钱。为什么我要参与国家大数据工作组和网信办的一些工作,就是因为我想处理一些政府层面的问题。

但是我愿意和政府官员交流,并不是说我喜欢政府的权力,权力对我来讲绝对没有什么吸引力。如果我需要权力,就在阿里继续管多一点人就行了。我真正喜欢的,是大数据带来的新生态。我跟一些政府朋友说,其实我最近挺开心的,因为我做投资之后出去见了很多小公司——这是生态的标志。

一个生态的形成意味着,你会看到非常多的、能生存下来的小公司。中国(互联网领域)只有三大巨头肯定不叫生态。能叫生态,必然是这个地方有很多的种类,很多你想都没想过的东西在出现,蚂蚁、蜘蛛……这些都是正常的生态。如果一个生态很干净,只有一座大山,那不叫生态。对于大公司来讲,比如对于阿里来讲,新生态并不是什么好事儿,因为有很多阿里的人出去创业,十几、二十几个人就组建成一家小公司。这对于阿里来讲是一件挺头疼的事情。但是对于生态来讲,这是一件好事。

我跟一个朋友开玩笑说,以前在阿里,有人、有钱、有数据,我出去见到很多小公司,没数据、没钱、没人。但我还是看到非常多的年轻人在创业,包括很多海归。我开始对这个生态产生信心。我们现在已经站在大数据带来的整个生态创新的临界点,这是大数据真正的意义所在。

作者为上海市科学学研究所副研究员。文章为作者独立观点,不代表主办机构立场。

◆ ◆ ◆

(0)

相关推荐