无尺度网络
1、无尺度网络是什么
在网络理论中,无尺度网络是带有一类特性的复杂网络,其典型特征是在网络中的大部分节点只和很少节点连接,而有极少的节点与非常多的节点连接。
这种关键的节点(称为“枢纽”或“集散节点”)的存在使得无尺度网络对意外故障有强大的承受能力,但面对协同性攻击时则显得脆弱。
现实中的许多网络都带有无尺度的特性,例如因特网、金融系统网络、社会人际网络等等。
人造的网络结构大多是规则的。
在随机的网络结构中,节点与其他节点的连结的数量呈正态分布;在规则的网络结构中,节点与其他节点的连结数量是固定的。
以上两类网络中,节点与其他节点的连结的数量分布都有规则可循,因此是有尺度的网络。
然而,用数学方法描绘互联网时,出乎意料地发现有些节点与大量的其他节点连结,形成一个个集散中心(称为集散节点),因而把互联网这样的网络称为无尺度网络(scale-free network)。
无尺度网络的特性,在于其度分布没有一个特定的平均值指标,即大多数节点的度在此附近。在研究这个网络的度分布时,Barabási等人发现其遵守幂律分布,也就是说,随机抽取一个节点,它的度d是自然数k的概率。
也就是说d=k的概率正比于k的某个幂次(一般是负的,记为− γ)。因此k越大,d=k的概率就越低。然而这个概率随k增大而下降的“速度”是比较缓慢的:在一般的随机网络中,下降的速度是指数性的,而在无尺度网络中只是以多项式类的速度下降……
停,停,停……
还是先从问题出发吧!无尺度网络的提出,无疑是跟追随幂律分布的复杂网络有关。
埃尔德什和莱利的随机模型依赖两个简单且经常被忽视的假设,那就是静态和平等。
大量的研究发现,真实网络的特性是生产机制和偏好连接,随机网络的两大特性被颠覆。
2、首先是生长机制
每个网络都是从一个小的核开始,通过添加新的节点而增长。
万维网是唯一一个在数学上证明存在枢纽节点的网络。为了理解万维网,我们努力探索它独有的特征。
关于万维网,有一点大家都认同:它在不断生长。每天都有新文档添加到万维网中:
有些是个人讲述其爱好或兴趣的;
有些是公司推广在线产品和服务的;
有些是政府向市民发布信息的;
有些是大学教授公开课件讲义的;
有些是非营利机构向公众介绍其服务的;
有些是电子商务公司为了盈利而设计的。
尽管种类多样,但大多数真实网络具有共同的基本特征:生长机制。
随意选择一个你能想到的网络,下面的情形很可能就是正确的:从少数几个节点开始,通过添加新的节点,网络增量式生长,逐渐到达现在的规模。
很明显,生长迫使我们重新思考模型的假设。
埃尔德什—莱利模型和瓦茨—斯托加茨模型都假设我们拥有固定数目的节点,然后将这些节点以某种巧妙的方式连接在一起。
因此,这些模型生成的网络是静态的,也就是说,节点数目在网络生命期内保持不变。
相比之下,我们的例子表明,对于真实网络而言,这个静态假设是不合适的。
相反,我们应该将生长机制整合到网络模型中。这是我们在试图解释枢纽节点时得到的最初见解。
如此一来,我们就颠覆了随机宇宙的第一个根本假设——静态特性。
3、其次是偏好连接
好莱坞内外的人都知道一个看似矛盾的观点:为了得到好的角色,你需要先出名,而想出名又需要先得到好的角色。
连接度高的演员更有可能得到新角色,拥有较多链接的网页更有可能被连接,引用次数多的论文更有可能获得新的引用,连接者会结交更多的朋友。
我们在不知不觉中遵循着某种偏见,以较高的概率去连接自己知道的节点,这些节点是万维网中链接数较多的节点。
是的,人们更喜欢枢纽节点。
万维网和好莱坞网络让我们不得不放弃随机网络固有的第二个重要的假设——平等特性。
在埃尔德什—莱利和瓦茨—斯托加茨的模型中,网络的节点没有差异,因此,所有节点以同样的可能性获得链接。
事实却是另外一幅情形,网络演化由偏好连接这个微妙而不可抗拒的定律支配着。
受该定律的影响,我们会在无意间以更高的速度向已经拥有大量链接的节点添加新链接。
这个简单的富者愈富的现象,可能出现在大多数网络中,它能够解释我们在万维网和好莱坞演员网络中观测到幂律的原因。
4、真实网络的规则
我们发现,真实网络由两个定律支配着:生长机制和偏好连接。
每个网络都是从一个小的核开始,通过添加新的节点而增长。
然后,这些新节点在决定连向哪里时,会倾向于选择那些拥有更多链接的节点。
这些定律和以前的模型明显不同——以前的模型假设网络中的节点数目是固定的,节点之间是随机连接的。
但是,生长机制和偏好连接这两个定律,是否已经足以解释真实网络中碰到的枢纽节点和幂律呢?
为了回答这个问题,1999年发表在《科学》杂志上的一篇论文提出了一个包含这两个定律的网络模型。
模型很简单,根据生长机制和偏好连接,网络生成算法可以通过下面两个直接的规则定义出来。
A.生长机制:每个阶段,我们向网络中添加一个新节点。该步骤强调网络每次增加一个节点。
B.偏好连接:我们假定每个新节点和已经存在的节点之间形成两个链接。选择给定节点的概率正比于该节点拥有的链接数。也就是说,如果有两个节点可供选择,其中一个节点的链接数是另一个的两倍,链接数多的节点被选到的概率也是另一个节点的两倍。
这就是无尺度模型。
5、如何简化理解
为什么无尺度模型能够产生枢纽节点和幂律呢?
首先,生长机制发挥着重要作用。
生长机制让资历老的节点具有明显的优势,让它们拥有最多的链接。
然而,资历还不足以解释幂律。
枢纽节点还需要第二个定律的帮助,那就是偏好连接。
偏好连接引入了富者愈富的现象,帮助连接度较高的节点得到更多的链接,而后来者的链接数会相应地减少。
富者愈富现象自然导致了真实网络中观察到的幂律。
在大多数情况下,生长机制和偏好连接都是同时出现的,枢纽节点和幂律也是同时出现的。
通过将网络视为随时间持续变化的动态系统,无尺度模型体现了一种新的建模思想。无尺度拓扑预示着,某种组织原则在网络形成过程的每个阶段都发挥着作用。
无论网络变得多么大、多么复杂,只要偏好连接和生长机制出现,网络都将保持由枢纽节点主导的无尺度拓扑。
心归航,再启航
愿每日微小知识激发你的深刻思考