大自然确实有一个最喜欢的数字,那就是“1”,神奇的本福德定律

数字,我们随处可见。例如,在本文开头的图像中,有许多数字,但研究表明,这些数字中以“1”开头的比例比预期的要高。这怎么可能呢?1881年,加拿大裔美国天文学家西蒙·纽科姆做了一个有趣的研究。他注意到一本以数字“1”开头的对数表的书页比其他书页磨损得更厉害。
1938年,美国电气工程师弗兰克·本福德在20多个不同的数据集上验证了纽科姆的观点,这些数据包括:335条河流的表面积、3259个美国人口、104个物理常数、1800个分子量、418个死亡率,甚至还有一期《读者文摘》中包含的308个数字。他在一篇题为《反常数定律》的论文中发表了他的发现。

本福德定律

本福德定律,也被称为纽库姆-本福德定律,描述数集中数的前导位数的频率分布。它指出,数字“1”以第一位出现的概率约为30%,数字“2”以第一位出现的概率为17.6%,数字“9”以第一位出现的概率小于5%。
  • 数字频率分布
如果“1”和“9”之间的每一个数字作为一个数的第一个数字出现的概率相等,那么它们出现的概率都是11.1%。本福德定律仅适用于跨度多个数量级且非无量纲的数集。如果你还记得高中数学,数量级是一个数的对数,通常以10为底,它可以表示如下:
  • 1 = 1 x 10^0
  • 10 = 1×10^1
  • 100 = 1×10^2
  • 1000 = 1×10^3,等等。
那么,本福德定律适用于哪些数据集呢?它适用于街道地址、斐波那契数字、电费账单、股票价格、阶乘、房价、人口数量、死亡率、2的幂、河流长度,以及物理和数学常数。
斐波那契数是由两个从“0”开始的连续数相加形成的。
  • 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144…
  • 0 + 1 = 1,1 + 1 = 2,2 + 1 = 3,3 + 2 = 5,5 + 3 = 8
阶乘,写成n!为所有小于或等于n的正整数的乘积,例如,5 != 5×4×3×2×1 = 120。
物理常数包括:真空中的光速(c)、普朗克常数(h)、牛顿引力常数(G)和基本电荷(e)等。
  • 物理常数符合本福德定律
在对数尺度上,一个数(1到9)为第一位数的概率与尺度上数之间的间隔成比例。数字“1”的对数和数字“2”的对数之间的间隔要比数字“8”的对数和数字“9”的对数之间的间隔宽得多。数字“1”和“2”,“10”和“20”,“100”和“200”,以及数字“8”和“9”,“80”和“90”,“800”和“900”,间隔也是一样的。
  • 在对数刻度上的间隔
因此,任何随机数更可能落在较宽的区间而不是较窄的区间。值得注意的是,无论我们使用以10为底的对数尺度还是任何以大于2为底的尺度,这都是有效的。
以2为基数表示的数称为二进制数。它们总是以数字“1”开头,只包含“1”和“0”。你可能认识到这些是计算机使用的数字。
  • 十进制数及其对应的二进制

符合本福德定律的数据集

虽然股票市场价格非常准确地符合本福德定律,但在一个数量级内的一组数字却不符合。例如,成年人的身高以“4”、“5”、“6”甚至可能是“7”为起始数字,而智商得分在70到130或更高,就不太可能符合本福德定律。
但是,如果我们看看世界上最高的58座建筑的高度,无论用什么单位来衡量,“1”绝对是最常见的领先数字。这意味着不管我们用米、码、英尺、英寸或厘米来测量结构的高度,“1”仍然是概率最大的。
当一个数据集是尺度不变的,即与数据所表示的单位无关时,第一个数字的分布总是符合本福德定律。
如果我们看看世界上人口最多的150个国家的人口,数字“1”又赢了。

使用本福德定律

1972年,经济学家哈尔·瓦里安,现任谷歌的首席经济学家,建议使用本福德定律来检测经济数据中的欺诈行为。据传,美国国税局使用本福德法来分析所得税申报表,甚至在联邦、州和地方各级的刑事案件中也承认了本福德法。
在2002年欧元问世后,本福德定律被应用于必须将各种货币转换成欧元的商品价格。新欧元价格的第一个数字符合本福德定律,而第二个和第三个数字则不符合,这就证实了将价格转换成新货币是有困难的。
(0)

相关推荐

  • 使用本福德定律甄别数据造假(Benford's Law)

    数据造假的甄别在数据分析领域是一个热门的话题,也是对数据分析师的一项挑战.分析数据造假的方法有很多种.我们在前面的系列文章中曾经介绍过两种检验作弊流量的方法.一种是根据历史经验及分布情况的多维度交叉检 ...

  • 如何打造一个蜜蜂喜欢的园子?

    朴自然与您相伴的[2354]天 我们能吃到绝大部分的蔬菜和水果,离不开蜜蜂的功劳.长大了才知道,为什么课本里总是将这些小家伙们描述为"勤劳"的,为什么园子里它们的数量越多越好?园子 ...

  • 一个喜欢你的,一个你喜欢的,该怎么选择

    [管理情绪做倔强的小草]一个自己的喜欢的,一个喜欢自己的,当遇到这样的选择时候该怎样去做?该如何取舍引用孟子<鱼我所欲也中的>鱼与熊掌不可兼得更符合选择者所面临的状态. 选择喜欢自己的,心 ...

  • 喜欢一个人没有错, 错就错在喜欢一个不喜欢自己的人

    爱情让一个人卑微,再见让一个人担心,脆弱的心门,藏着无情的风筝,总是失落的徘徊,感恩人生的在意,无奈还是一种季节,人生总是仓促,悲伤还是那么美丽. 唯一的放下,是人生的追逐,总有一份放弃,也有一份失去 ...

  • 一个很喜欢你的女生,突然不主动了,多半是因为这些!

    张小娴说,一个男人对一个女人的伤害,不一定是他爱上了别人,也可能是让她失望了. 深以为然. 在爱一个人的时候,男人会对身边的女人所有期待,女人也男人,其实也是一样的.甚至说,作为女人,因为生来心思细腻 ...

  • 一个不喜欢走人情、和领导接触的人,根本不可能有出路

    科学研究表明,在人的一生中,占据大部分时间的除了休息就是工作,我们生活很可观的一部分都被工作占据,因此,我们也会将许多精力花费在工作当中. 而在职场当中,不可避免的就是人际交往.除了与同事交往,更重要 ...

  • 女生应该选一个自己喜欢,而且还有潜力的男...

    女生应该选一个自己喜欢,而且还有潜力的男生,我们叫这为眼光.

  • 如何挽回一个不喜欢我的人?

    更多精彩等你发现 WeGo团队原创 分手后想挽回,你是怎么做的? 是不是想办法联系上,约出来好好聊,让前任改变主意? 竭尽全力去表达爱意,说着有多爱,无法放下,只要回头一切好商量,你愿意改变,肯为TA ...

  • 总有一个你喜欢的女妖精

    很久以前我看西游记的时候产生了一个疑问,为什么有的妖被叫做妖精,比如蜘蛛精狐狸精白骨精,而另一些妖却被叫做妖怪呢,比如黄风怪黄袍怪.后来终于有人解答了我这个疑问,答案是:长得漂亮的都叫妖精,长得丑的都 ...

  • 苏东坡:请给一个不喜欢我的理由!呵呵!

    唐诗宋词天地 1周前 说到苏轼,我们脑海中冒出来的肯定是那些个名句,然后就是他彪炳史册的功绩,留名青史的文学成就,但今天,我想带你看看一个不一样的苏轼. 程十发 1977年作 苏东坡画像 苏碎嘴 苏轼 ...