哪类夫妻离婚率最高?|大数据下的人类真实面目
我通讯录有384个朋友。在图1中,每一个圆圈代表一个朋友,中间那个点代表我自己。我右侧那个黑色的点代表我的妻子河西。连接各点的灰色线条代表着人与人之间的联系。
图1很好地展现了我的朋友圈,根据共同好友的数量对我的好友进行划分,哪两个人的共同好友多,那么代表他们的那两个圆圈就靠得近。
图1 我的社交图谱
我们可以将这些小圆圈想象为“铁粉”,这些“铁粉”被友谊的力量磁化之后,落到桌面上固定了下来。你可以从图上发现我生活中的联系人网络。
在图1中,我的姻亲之间联系得非常紧密,一条条灰色的线条相互重叠,这个聚集区被标为A区。我的中学同学的聚集区被标为B区。我的同事的聚集区被标为C区。和我一起游戏、运动的朋友的聚集区被标为D区。
从这幅图中,你甚至能读出来我曾经的和未来的音乐生涯。我在一个乐队里待过几年,跟着乐队到处巡回演出。图左侧那些相对孤立的圆圈主要是我在演出之路上遇到的人。他们彼此之间赖以维持关系的纽带是音乐,我的算法无法体现他们之间的联系。
在图1这幅社交图谱的基础上,我进行了拓展,将河西社交图谱与我的社交图谱合并在了一起,显示出了我们作为一对夫妻的社交网络范围(见图2)。
深红色的点表示我和妻子共同的朋友。
图2 我和妻子的社交图谱
这幅图以枯燥而抽象的方式描绘了我和妻子的朋友圈。从该图中,你可以看出我们两人生活的交集。仅仅从这幅图来判断,你就可以看出我和河西离婚的可能性会远远低于其他夫妻。
像这种以点和线为基础的分析方式就是网络分析。网络分析并非一门新兴的科学,它已经存在了将近300年的时间。
人类历史上有据可查的第一个网络分析问题就是“哥尼斯堡七桥问题”。
18世纪初,在普鲁士哥尼斯堡镇(今俄罗斯加里宁格勒)流传着这样一个问题:有七座桥将普雷格尔河中两个岛及岛与河岸连接起来(如图3 所示),是否可能从这4块陆地中任一块出发,恰好通过每座桥一次,再回到起点呢?
图3 哥尼斯堡七桥问题
莱昂哈德·欧拉在1735年访问普鲁士期间着手研究这一问题。他在《哥尼斯堡的七座桥》一文中阐述了他的论证过程。
他把现实问题简化为平面上的点与线组合,每一座桥视为一条线,桥所连接的陆地视为点。他将整个镇子视为一个网络,一个新学科就此应运而生。
他的论证过程是这样的:由于每座桥只能走一次,所以如果从某点出发后最后再回到这个点,那么这个点必须有偶数条连线,也就是有来路必有去路,这样的点称为偶顶点;相对地,连有奇数条线的点称为奇顶点。
因此,要解答这个问题,就简化成了在整个网络中寻找沿途的每一个点是否有偶数条连线(即偶数座桥)。
由于哥尼斯堡七桥问题中存在4个奇顶点,所以无法实现之前设想的走法,从而解答了这个问题。
这个以生活小事为论证对象的过程开创了数学的一个新的分支——图论。
欧拉这种节点和边的概念原本只是为了解决日常生活中的走路问题,但后来却帮助我们理解了很多其他问题。今天,图论得到了广泛应用,可以用来研究疾病与其传播路径、卡车与其行驶线路以及基因与其黏合酶,当然,也被用来研究个人及其人际关系。
如今,由于数据处理技术日趋成熟,网络理论展示了人们应该如何找工作,如何从无稽之谈里提取有用信息,甚至如何制作更好的电影。
网络理论中另一个长久以来形成的观点是“嵌入度”。
嵌入度的一种表现形式是两个人社交图谱的相交程度。简单来说,河西和我的嵌入度就是我们两人图谱中相交部分与整个图谱的比例。
利用各种资源(电子邮件、即时通信、电话)进行的研究表明,两个人的共同朋友越多,他们的关系就越牢固;关联越多,意味着他们待在一起的时间越多,关系越稳定。
社交图谱分析最开始关注的是“谁认识谁”,现在大抵仍然如此。网络的数据容量之广——你可以不费吹灰之力便认识六度以外的人——正在颠覆这种现象。对于人际关系,尤其是情侣关系,近来这些数据催生了一种新的有效的方式,来衡量两人之间的纽带有多牢固。结果证明两个人的生活应该不仅密不可分,而且以特定的方式紧紧相连。另外,网络分析评估罕见地将“谁不认识谁”作为重要的考量。
美国康奈尔大学的计算机科学家乔恩·克莱因伯格与Facebook的高级工程师拉尔斯·贝克斯特伦在2013年发表了他俩合著的一篇研究论文。
论文指出,在研究了超过130万对夫妻之后,他们发现夫妻二人之间拥有的共同好友越多,这对恋人就越有可能分手。
我们用两幅图来解释一下他们的观点(见图4)。
A和B代表一对夫妻。左图看似是比较理想的情况,夫妻二人的朋友圈交集非常多,嵌入度非常高,但婚姻关系较为牢固的却是右图所示的夫妻,因为一方是另一方在社交世界中的一座桥梁,这样的夫妻关系更为牢固。
图4 两种夫妻朋友圈交集
他们的理论听起来似乎有些奇怪,为什么要让你和爱人的朋友圈适度分散呢?
以我和我妻子河西为例。河西的表弟向东在她生活中的嵌入度就非常高。他们两个是一起长大的,他像她一样,几乎与大家族的每个成员都有联系,其中许多人我都不认识。
他们从小就认识,而河西和我才结婚7年。如果以向东和河西为中心绘制一个社交图谱,则非常类似于我在图4中给出的左图。
然而,向东不认识河西的同事,不认识河西的舞蹈团成员,也不认识河西的大学同学。但这些人我都认识,更重要的是,这三个群体的交集中只有我一个人,如果他们想要认识彼此,只有我能充当中间人。
所以,如果以我和我妻子为中间点绘制社交图谱,那么就比较类似于图4中的右图。值得注意的是,如果河西和我在一起工作,或者她不跳舞,或者我们读的是同一所大学,那么我们在彼此的社交网络中就不会扮演现在的角色。
克莱因伯格与贝克斯特伦将其理论称为“分散理论”,是因为它显示了如果没有你,你的社交图谱的分散度。也就是说,如果将你和你的妻子从中心位置移除之后(比如生了第二个宝宝之后淡出社交圈的情况下),你的社交圈子会不会完全垮掉。
我更喜欢夫妻之间的“同化”,因为我认为同化能够更好地体现出社交关系的精髓:同化程度较高的夫妻在多个相互分离的朋友圈中扮演着纽带般的特殊角色,夫妻二人的共同努力才能让社交网络变得更加密切。
同化的力量来自这样一个事实,即你的配偶往往是唯一一个被你介绍到自己朋友圈的人。你参加工作聚会,她在场;你参加同学聚会,她在场;你和朋友打一天球或打一天游戏,她也在场。几乎一年到头她见证了你参加的每一次公开活动。与此同时,这些同事、同学和球 友,虽然内部联系非常密切,但彼此之间却没有什么嵌入度,如果不同的群体 要发生联系,就必须依靠你和你的妻子作为中间人。
夫妻角色的相互同化之所以具有重要意义,能够用来衡量夫妻关系的牢固程度,是因为对于网络上的已婚人士而言,在75%的时间里,他们的配偶都是其社交网络同化得最严重的人。更重要的是,如果一对年轻夫妻的同化程度较低,那么他们离婚的可能性很有可能高出50%。