大数据之路的前方就是哲学
在没有大数据这一概念之前,人们总是习惯用自己的情感判断力与理智判断力去抉择事情。
我们认知事物的过程,或者说是成长的过程就是在用更广博的见闻和更成熟的思维提高自己的理智判断能力。需要反复磨练,并接触更多的实际事情来提高自己的情感判断力。
人们孜孜以求的“真实”或“真理”这个概念。以数以亿计的大多数人角度来讲,是一个共同认可的概念,但实际上是随机的、模糊的、虚幻的概念。真实或者说真理,它不是坏的,我们希望它是好的。
人们探索总结自然规律的动力来自于对现实的不满和对未来的渴求,或者说对不确定性的恐惧。所以我们始终在寻求更高的东西、更确定的东西、更共识的东西。这也就是古代人为什么会祭祀、祭天。这些活动和巫师的职责就是把不确定性的大自然当中某一部分,以确定性的形态展示给人们,让人们有一个踏实的共识。
同样,上面这一句话放到农业时代的生产规律和哲学上、工业时代的科学进步、放到互联网时代的普世理论和真理上都是准确的,甚至放到未来人工智能大数据时代的科学上,都是在解决从不确定性到确定性中间的这一过渡。
大数据的本质是发现相关性,从而替代因果性。大数据需要最广阔、最完整、最庞大的数据量去喂养。这就是从以前“适合大范围的规律总结”到现在“适合全数据的铁律总结”。以前我们从事实当中总结出来规律,现在我们通过大数据发现规律, 再去指导事实,也就是预测未来。
举个例子来说,传统的商店是等来了100个顾客把店里的10双手套都买光之后再去进货。而现在的网购平台,是通过大数据预测出来,每100个顾客会有10个顾客发生购买。然后等网站上已经有100个浏览量的时候就直接给本地发货,等待未来这10个顾客去把对应数量的手套买走。
从这之中能看出了点什么吗?虽然说顾客买手套儿是随机的,是看心情的。作为独立的顾客小张不买,小李可能会买,小李不买小王可能会买。但在大数据的眼里100个人当中,无论你个人是什么特性,一定会有一个数量的人来把这10双手套儿买走,这个数量就是10个。
把单个的人的行为升级聚合到集体的行为。虽然人任何的行为都是靠运气的,随机发生的事情,但是大数据不相信这种运气。人类的情感和思维是善变的,但从数量庞大的种群的行为偏好上来讲,它就是固定的。
说到不确定性,没有什么比人的想法和情感更具有不确定性的。等闲变却故人心,却道故人心易变。人们会说恋爱当中的女生情感反复不定。
假设:男孩给她脾气暴躁的女友惹了,这女孩儿很容易生气。从外人眼里看:事情的严重程度和女孩生气的程度都无法衡量。但引入大数据之后事情就变得更加清晰,比如说女孩儿在这种情况下生气的概率是80%。你可以理解成,男孩惹了女孩100次,女孩会有80次生气。也可以理解成在被男票惹到后,100个女孩里80个女孩会生气。
但是,随着事情发生的次数变多,男孩反复惹女孩生气的时候,男孩会变得更加收敛,女孩儿会变得更加善解人意,他们之间会达成两个人最合适的平衡状态。让对方的脾气变得更像自己,或者让自己的脾气更容易让对方接纳。可以称为调和,可以称为夫妻相。这也正是大数据指的回归平均值。离散的数据越来越趋近于中间的平衡状态。
等下一次两个人的争吵又要发生的时候,那我可以从大数据的图表上看出来:什么样的矛盾会把女朋友惹火,引发的脾气是在哪个区域范围——这似乎就成了哲学上的知性和先知。
这样,人的行为就变得遵从了先见的规律,掌握了变化中的不变。从现象里抽离出来最本质的规律,把无归结成为多,再把多归结成一,大数据学家的争论将变得和哲学家的争论没多大差别。那么,如果未来是一个数据化的世界,人人都是数据化的话。人会变得更加苍白了还是更加哲学了?
人类会变得完全的数字还是完全的哲学呢?这个问题还是期待有着科学家头衔的哲学家去解决吧。
另一方面,大数据是对以往发生了的事情规律总结,输入的是既有事实,但是未来世界是充满了不确定性的,比如人类在秦朝人们提到“杀伤性武器”会想到高十丈的战车,不可想象原子弹是个什么概念;比如17世纪的人们提到“最有效率的沟通”可能是需要造出来和子弹一样快的通信火车,不可想象一个叫手机的小黑盒子是什么概念……
包括我们人类自己也不知道2050年我们用什么沟通,用什么工具、脑中植入的芯片?甚至意念?我们也不知道那时候我们的工作是什么样,所以即便是算无遗策的大数据也不可能做到神预测,就像没有任何一个哲学观是人类全体认同的,因为人的因素是最大的变数,人心的差异才是“世界上最遥远的距离”