神奇的本福特定律

从常理上说,世界上千千万万的数据(非开0头)的开头数字是1到9的任何一个数字,而且每个数字开头的概率应该差不多。现在,请你随便找本书,统计一下上面的各种开头数据的开头数字,看看是否符合我们的设想。

  如果你统计的数据足够多,你就会惊讶的发现,开头数字是1的数据最多,大约占了所有数据的1/3左右,打头是2的数据其次,往后依此减少。难道是人们对1情有独钟,把它时常写在数据的最前面吗?

 肮脏的对数表书页

  首先要恭喜你,你发现了数学上的一个有趣的定律,这就是本福特定律。据说这个定律在1881年首先被一位天文学家在分析数据的时候发现,但是当时科学家们并没有把这个发现当回事。直到1935年,美国的一个叫本福特的物理学家从新发现了这个定律。当时,他在图书馆翻阅对数表时发现,对数表的头几页比后面几页更脏一些,这说明头几页在平时被更多的人翻阅。这并不奇怪,因为许多读书的人都先看看书的开头,不喜欢就不再读下去。但是,对数表却是一种数学工具,只有需要查数据的人才会去碰它。因此,头几页如果比较脏,这就说明人们查阅的数据大多在头几页里,也反映出人们所使用的数据并不是散乱的,而是有些数据使用的频率比较高。

  本福特再进一步研究后发现,只要数据的样本足够多,同时数据没有特定的上限和下限,则数据中以1为开头的数字出现的频率并不是人们想当然认为的1/9,而是0.301,这说明30%的数字都以1开头。而2为首的数字出现的频率是0.176,3开头的数字出现的频率为0.125,往后出现频率依此减少,9打头的数字出现的频率最低,只有0.046。这个规律甚至能用一个数学方程来表示。

  除了对数表,其他类型的数据是否也有这样的现象呢?本福特开始对其他数字进行调查,发现各种完全不同的数据,比如人口,死亡率,物理和化学常数,棒球统计表,半衰期放射性同位素,物理书中的答案,素数数字中均有这个定律的身影。

 定律成因之迷

  本福特定律在生活中很常见,但是为什么人们使用的数据会有这样的现象呢?几十年来,人们提出了一些猜想来解释这个现象。

  1961年,一位美国科学家提出,本福特定律其实是数字累加造成的现象。比如,人们用千米作为河流的长度单位时,显然长度在1000千米到2000千米之间的河流(长度数据开头是数字1)要多于2000千米到3000千米的河流(长度数据开头是数字2),小河流很多,而大河很少,因此河流的数据满足本福特定律。同样,以英里,光年,微米,尺等作为长度单位的数据也都满足这一定律。

  即使没有单位的数字,只要有累进递加,本福特定律就会出现。比如,假如股票市场上的指数一开始是1000点,并以每年10%的速度上升,那么要用7年多的时间,这个指数才能从1000点上升到2000点的水平;而后由2000点上升到3000点只需要4年多的时间;由9000点上升到10000点所需要的时间更短,只要1年就可以了。但是,如果要让指数从10000点上升到20000点,还需要7年多的时间。因此我们看到,以1开头的指数数据,出现的频率比其他数字开头的指数数据要高得多。

  这个解释似乎和合理,但是却不能解释对数表,因为对数表中的数据既没有单位,也不存在什么累加的现象,只是对岸所有的数字取对数得到的大量数值,里面却出现了规律性的东西。看来,本福特定律产生的真正原因并没有得到揭示。

  此外,还有一些生活中的数据并不符合本福特定律。比如,人们研究了彩票的中奖号码,发现里面并没有这样一来的规律,否则数学家就可以利用该规律增加自己中奖的概率了,什么样的数据中没有本福特定律?这个问题同样让数学家难以解决。

  让做假帐者心寒

  虽然本福特定律不能让买彩票的人发财,但是在生活中却可以发挥作用,让做假帐的人现出原形。

  数学家发现,帐本上的数据的开头数字出现的频率符合本福特定律,如果做假帐的人更改了真实的数据,就会让帐本上开头数字出现的频率发生变化,偏离本福特定律中的频率。

  非常有趣的是,数学家门发现,在那些假帐中,数字5和6居然是最常见的打头数字,而不是符合定律的数字1,如果审核帐本的人掌握了本福特定律,伪造者就很难制造出虚假的数据了。2001年,美国最大的能源交易商安然公司宣布破产,当时传出该公司高层管理人员涉嫌做假帐的丑闻。事后人们发现,安然公司在2001年到2002年所公布的每股盈利数字就不符合本福特定律,这说明了安然的高层领导确实改动过这些数据。

  最近数学家还把本福特定律用于选举投票中。票数的数据也符合这个定律,如果有人修改票数量,就会漏出蛛丝马迹来,数学家依据这一定律发现,在2004年美国总统选票中,佛罗里达洲的投票存在欺诈行为;2004年委内瑞拉和2006年墨西哥的总统选举中也有类似现象。

  虽然本福特定律的形成原因还没有最终解释,但这并不妨碍人们把它运用到越来越多的生活领域中,帮助人们伸张正义,去伪存真。

(0)

相关推荐