大数据,一场事先张扬的“骗局”
2018年的中国发展高层论坛上,李彦宏的一句话给百度惹了一个大麻烦。
在谈到用户隐私问题时,李彦宏说:“我想中国人可以更加开放,对隐私问题没有那么敏感,如果他们愿意用隐私交换便捷性,很多情况下他们是愿意的,那我们就可以用数据做一些事情。”
这番话里实际上暗藏着一个近乎无法反驳的“代价论”。在我们所处的社会中,任何“获得”都需要付出相应的代价,好比获取财富的代价是失去部分自由,享受美食的代价是失去一点健康。而享受便捷的代价在李彦宏来看显然是牺牲一点隐私。
“代价”是理性权衡的产物,是两害相权取其轻。所有的选择都意味着失去,我们做出选择的同时,也便接受了如此选择的代价。但前提在于,我们至少要有自由选择的权利。人们当然“愿意”用隐私来交换便捷,但此种“愿意”是不得已而为之的“愿意”,因为若要使用便捷的互联网服务,他们别无选择。
当然,在开放多元的互联网世界里,任何服务都不是不可取代的。你可以拒绝使用百度的搜索服务,也可以拒绝使用腾讯的社交软件。但这么做的代价可能不仅仅是失去便捷性,你很可能因此要比他人付出更大的时间成本和交际成本。
正如社会学家郑也夫在《代价论》一书中说的那样:
“在团体生活中,不愿付出必须付出的代价,往往会令你格外付出更大的代价。”
一场事先张扬的“骗局”
自互联网诞生以来,技术便循环往复的瓦解、重构着人类社会,新的技术主导了社会文化的形成、改变了世界经济的运行规则,甚至直接或间接地冲击着现有的社会制度。
“技术决定论”被整个社会奉为圭臬,科技寡头们因此自然而然地掌握了技术领域的话语权。李彦宏们的强势和自信原因无他,皆是因为他们笃定地认为人们不会拒绝新的技术,他们清楚地知道在技术的大变革时代人们无一不将在茫然无措中变得无助且盲从。
正如我们看到的那样,在获取用户数据这件事上,没有比互联网企业更加野蛮粗暴的了。看看你手机中的应用,哪一个应用在安装之后的第一件事不是“胁迫”你允许它们访问你的通讯录、位置,甚至相册这种高度隐私的内容。你当然可以拒绝,但这么做的结果是你将无法使用这一应用。
人们不得不接受这样的“霸王条款”,一个重要的原因是互联网企业事先大肆宣扬了“牺牲隐私”能够换来的“好处”。
电商平台将更加精准的营销服务作为技术优势大肆宣扬,它们声称如此可以让你获得更好的消费体验;社交平台将位置服务和隐形的社交关系链作为核心功能,它们声称如此可以让你结实更多的好友;资讯平台获取你的性别、年龄、兴趣来实现所谓的“智能推荐”,它们声称如此可以让你快速找到感兴趣的内容……
应该承认,我们的的确确在“牺牲隐私”的同时获得了一定的“便捷”,但我必须指出的是这种所谓的“便捷”与“人工智能”毫无关系。
全世界的科技公司参与炮制了这场事先张扬的“骗局”,在鼓励用户“牺牲隐私”的过程中,他们巧妙地偷换了“大数据”与“人工智能”两个概念,让公众误以为二者之间存在某种程度上的等号关系。
事实上,它们只是通过获取你的隐私更加全面的了解你,掌握你的消费习惯、行踪轨迹、甚至性格弱点,以此来在恰当地时机为你提供无法拒绝的服务,急你所需、投你所好。而在互联网诞生之前,这项工作通常需要线下走访、用户调研来完成。是互联网,让一切变得前所未有的简单。
当互联网企业掌握你足够多的数据之后,你不可能不爱上它们的服务。这就好比一个对你的口味一清二楚的厨师,做出的饭菜总是一如既往的可口那样。让你离不开它们的服务,就是它们炮制这场“骗局”的动机。
大数据里走不出真智能
一个让人感到沮丧的事实是,由于技术的话语权集中在少数科技寡头手中,在这场大数据“骗局”面前,普通公众要么仍然被蒙在鼓里,要么无可奈何地“甘愿”受骗。科技巨头们不厌其烦地强调人工智能是不可阻挡的趋势,这很容易让公众陷入一种认知误区——把个人数据悉数交出是迟早的事。
问题是,数据究竟在人工智能的进化中扮演着何种分量的角色?
人工智能的研究者们通常将算法、算力和数据并称为人工智能技术发展的三要素。他们相信通过对海量数据的获取和计算,AI有朝一日将具备超越人类的智慧。但一个被忽略的问题是,人类社会现有的数据已经足够用于人工智能的学习,但为何后者仍然发展不出自主意识?
在我看来,掌握话语权的技术寡头们出于商业上的需要,刻意地过分夸大了“数据”之于人工智能技术的重要性,从而让大数据的“骗局”进行地更加名正言顺、理直气壮。
支持此种观点的证据在于,目前AI的计算速度已经比人类快得多,AI获取数据的能力以及可供其计算的数据量也早已达到了惊人的规模,但为何AI依然无法达到人类的智慧程度?康奈尔大学研究团队曾针对微软、谷歌、百度等公司进行过一项AI智商测试,结果显示,这些连接着庞大的云端数据库的AI,智商却远不及一名6岁的学前儿童。
这足以说明,数据是AI技术发展的必要因素,但绝不是起到决定性作用的关键因素。AI的进一步发展不在于数据,恰恰相反在于数据之外的东西。
盛大CEO陈天桥现在致力于脑科学领域的投资和研究,他曾提出过类似的质疑:
“机器可能发展出意识,超越人类。这在理论上是可能的。但它们计算的速度已经比人类快得多,但它们仍然没有任何意识。肯定缺少了一些我们不知道的神秘事物,就像计算机缺少合适软件的情况一样。”
人工智能发展出自主意识究竟缺少了什么“神秘事物”我们不得而知,但可以肯定的是绝不是“数据”。
因此,当那些宣称已经掌握了人工智能技术的企业、产品或着某个手机应用仍然向你索要个人数据时,事情就变得非常可疑。因为接下来你会发现,它们所谓的人工智能几乎完全依赖于你的个人数据。假如你不允许任何应用获取你的个人信息,那么你手中的智能手机将变得比功能机“智能”不到哪儿去。
技术寡头强权下的隐忧
相比“骗取”公众隐私数据,一件更值得担忧的事情是,掌握话语权的技术寡头对人工智能技术刻意地片面宣传,正让公众对人工智能的认知愈发狭隘。
特别是当谷歌的Alpha Go一举打败人类围棋冠军,当IBM的机器人沃森做出比医生更加靠谱的治疗方案,这些极具话题性的消息接连传出时,“神经网络”、“深度学习”,这些原本生僻专业的术语开始为公众所熟知,长期占据着有关人工智能技术的舆论阵地。
事实上,人工智能作为一个交叉学科,除了计算机科学之外,还涉及哲学和认知科学、数学、神经生理学、心理学等众多学科。但在技术寡头的强权之下,围绕这些学科的讨论在互联网上几乎绝迹。对计算机技术的单一化研究和讨论,或许将把人工智能技术的发展推向狭隘,甚至死胡同。
从事人工智能哲学研究工作的复旦大学哲学学院徐英瑾教授,就曾谈到人工智能技术路径的唯一化现象:
“如果大家能意识到技术背景里有哲学争论,就会明白——你所掌握的技术路径并不唯一。而如果仅仅站在具体学科分类的内部来看学科,就不容易受到其他学科思维方式的滋养。”
这样的担忧不多余。当技术寡头对人工智能技术的研究过度集中在大数据、神经网络、深度学习这些单一的技术路径时,它们很可能会因此错过人工智能技术发展真正的突破点。而这个突破点很有可能在“算法、算力、数据”这所谓的三大要素之外。
我无意像陈天桥那样把人工智能的发展推向“神秘化”,但人工智能无疑是一项涉及学科庞杂的研究,谁也无法确定我们当下的研究是否选择了正确的路径和方向。就像人们因为选择了便捷性而牺牲了个人隐私一样,那些垄断了技术资源的科技寡头们选择将研究集中在计算机科学领域,一定也错过了许多重要的东西。
如果说“大数据”是科技寡头们编制的一场骗局,那么很可能它们也同时欺骗了自己。