走进高维空间——概率论与高维空间的深层次联系 2024-08-07 00:45:48 欢迎来到高维系列的第四部分,在这里我们将探索高维空间中一些奇怪而又令人匪夷所思的现象。开始之前,我们一起复习一下前三个部分的一些重要结论:第一部分,我们得出,在无限维空间中球体的体积都集中在边界上,我们只能知道这个结论,但是无法想象! 第二部分的结论是,在高维空间中,内切于求内的立方体不完全在球体以内。 在第三部分中,我们推导出,在无限维空间中,点与点之间的距离都是相等的。 今天,我们将进入高维空间中的概率论世界,尝试并阐明一些令人困惑的现象。当我第一次了解高维空间中概率论的一些基本概念时,我完全被震撼了。高维空间和概率论之间的联系是非常深刻的,而且大多超出了我目前的知识范围。然而,通过在概率论中引入一些相对简单的概念,并将它们与我们已经探讨过的情况联系起来,我们可以对一些事物在高维空间中的行为有一个小小的了解。亲爱的读者朋友们,做好准备了吗?它可能会以意想不到的方式改变你的想法。 随机变量 引入随机变量的概念是很有必要的。首先,变量只是一个符号,如X或Y,它表示某个集合的任意值。随机变量的值取决于某些随机现象的结果。随机变量有一组可能的值,以及一个概率分布,它定义了每一个可能值发生的概率。随机变量的一个典型例子是掷骰子。这里,随机变量有6个可能值1、2、3、4、5、6,每个值的概率都是1/6。如果掷出一个3,我们可以把这个值看成是随机变量的一个实现值,但在掷骰子之前我们只知道它的可能值以及每个值对应的概率。另一个常见的随机变量的例子是抛一枚均匀的硬币。这里,随机变量只有两个可能的值,正面或反面,每个出现的概率都是1/2。随机变量可能比掷骰子和抛硬币复杂得多,但最基本的概念仍然是一样的。一个随机变量是由它的可能值以及每个值发生的概率定义的。 空间中的点作为随机变量的实现 当我们在n维球体内部选择一个随机点时,每一个点的坐标实际上是一个随机变量的不同实现!考虑一个以原点为中心、边长为1的n维立方体。为了在n维立方体内生成一个随机点,我们需要随机生成与该点相关的n个坐标值,每个坐标值在-0.5到0.5之间。现在,重新考虑掷骰子事件。如果我们掷n次骰子并记录结果,我们将得到一个n个整数的序列,范围从1到6。你看到它们之间的联系了吗?这和在-0.5和0.5之间随机生成n个坐标是完全一样的!在空间坐标的情况下,随机变量是一个更复杂的变量,但基本思想是一样的,每一个都与一个特定的概率有关。在掷骰子或超立方体的单个坐标的情况下,每个可能的值都有相等的概率。这被称为均匀概率分布,它可以存在于一组离散的结果(例如,掷骰子的六个可能的整数值)或一组连续的结果(例如,所有在-0.5到0.5之间的可能值)上。我们刚刚确定n维立方体内随机点的每个单独坐标都是一个随机变量,n次抛掷骰子的结果也是如此。 随机变量和 随机变量的概念是概率论和统计学的基础。当你总结随机变量时,会发生一些令人难以置信的事情,我们很快就会看到。再考虑一枚均匀的硬币。假设我们感兴趣的是在给定的抛硬币次数中数出正面的次数。为了更加方便量化,我们把正面的结果编码为1,反面的结果编码为0。之前,我们看到,抛一次硬币有两个可能值。我们说抛10次硬币,正面的次数是10个独立分布随机变量的和。为什么独立?独立意味着每次抛硬币的结果不依赖于其他的结果。每一面都以50%的概率出现。再强调一次,投掷10次硬币正面的次数是10个结果(0或1)的和。随机变量有一些特别优雅的性质,它们绝对是统计学领域的基础(例如,中心极限定理)。不管怎样,让我们回到正题上来,考虑一下抛10次硬币得到正面的次数。我们期望硬币正面朝上的次数是多少?既然每次抛硬币都有50%的机会是正面朝上,或许一个合理的猜测是十次抛硬币中有五次是正面朝上。根据经验,我们知道硬币可能会有5次正面朝上,但它也可能0次或10次,或中间的任何数。毕竟,它是随机的!让我们模拟抛硬币10次并记录硬币正面朝上的次数,然后重复这个实验1万次!这样,我们就可以想象一次投掷10次的结果的分布。 这看起来很合理,对吧?这是1万次投掷硬币10次的结果分布然后记录正面的次数。得到0个正面或10个正面似乎很少见,得到5个正面最常见,这是我们最初的猜测!但是我们要注意的是,我们确实看到了结果中有很大的可变性。我们并不总是得到5次正面朝上;相反,我们看到了1万次试验的全部结果。虽然很难从图中分辨,但有大约10次试验结果是0次正面,另外10次结果是10次正面。但是它和高维空间有什么关系呢?别急,我们很快就会揭晓!与其抛10次然后数正面,不如抛100次然后数正面的次数,然后重复1万次!我们现在讨论的是100个i的和。下面是我们10,000次试验的结果: 哇!这看起来确实有点不同。如果我们投掷100次并记录正面的数量,我们看到的可能的正面数量是0到100之间的任意数,对吧?然而,根据我们的10000次试验,一个试验中出现少于30个正面或多于70个正面的情况是极其罕见的。我们不再像抛10次硬币那样看到所有可能的结果。实际上,看起来每次试验中正面的数量更集中在平均值(50)附近。我们再来做一次,但不是扔100次,而是扔1000次,它等于1000个i的和。下面是我们10,000次试验的结果: 这里有一个明显的趋势。看起来,随着抛硬币次数的增加(例如,从10次到100次到1000次),我们在每次试验中看到的正面的次数会越来越集中在相对于所有可能值的平均值周围。抛掷硬币现在看来可能微不足道,但我们很快就会发现,我们现在看到的现象绝非如此。 高维度的空间 我们上面所演示的并不是投掷硬币的特定现象,而是一种被称为测量集中的普遍现象的表现。对这一普遍现象的所有理论和含义的全面理解远远超出了我的能力范围。然而,这一现象最值得注意和可能广泛适用的表现之一是我们在抛硬币时所观察到的,也就是说,当抛硬币的次数累加后,观察到的结果会更紧密地集中在平均值周围。这是由概率统计中一个非常重要的定理描述的,称为大数定律。大数定律将这一概念形式化,即随着抛硬币次数的增加,会越来越接近一半正面,一半反面。对于那些熟悉的人来说,上面的情节会让人想起我们在之前系列的情节,特别是在第一部分和第三部分。让我们再次回顾一下。在本系列的第一系列中,我们看到从n维球中随机选择的点随着n的增加会更集中在球的外边界。换句话说,随着空间维度的增加,原点和每个点之间的距离普遍接近于1;也就是说,它们到原点的距离大致相同。在第三系列中,我们看到从n维球中随机选择的点对,随着n的增加,会更加集中在平均距离附近。当我们进入更高维度时,所有点与其他点的距离大致相同,几乎没有变化。考虑到n维立方体。让我们做一个实验,从以原点为中心的n维立方体中选择大量的随机点,并测量每个点与原点之间的距离,类似于我们在第一系列中所做的。我们将对10维,100维和1000维进行这个实验。下面的图显示了每个n维立方内10000个随机点到原点的距离分布: 就像我们之前看到的,当我们进入更高的维度时,看起来这些点在离原点的特定距离周围变得更紧密。如果你还没有对这些联系感到疯狂,我建议你看看10次、100次和1000次抛硬币时正面出现的次数。它们与原点和10维、100维和1000维超立方体内随机点之间的距离图几乎相同!这是巧合吗?我认为不是!让我们更深入地探究一下到底发生了什么。我们已经知道在给定的抛硬币次数中,正面的次数是随机变量i的和。当我们增加被求和的项数时,随机变量会更加集中在更少的可能值中(例如,大数定律)。但这和高维空间有什么关系呢?更具体地说,它和n维立方内的一点到原点的距离有什么关系?还记得我们是如何计算从一点到原点的距离的吗?让我们再来看一看: 换句话说,n维空间中给定点到原点的距离是该点各坐标平方和的平方根!还记得之前我们把空间中随机点的每个坐标描述为随机变量的实现吗?如果一个随机点的坐标是随机变量,那么这些坐标的平方也是随机变量。更进一步,为了计算从一点到原点的距离,我们要对每个单独坐标的平方求和,所以我们是对随机变量求和!我们可以忽略这个平方根因为它不会改变基本的概念。我们刚刚意识到计算n维立方中任意一点到原点的距离需要对i 求和。同时,当我们增加维度n时,我们也在增加项的数量。我们在上面抛硬币的实验中也看到,当我们增加i,我们观察到的结果越来越集中在平均结果附近。所以,n维高维立方体中所有的点聚在一起距离原点的距离是相同的这一事实与测量浓度的概率现象有关。老实说,我甚至不知道这到底是怎么回事,但这太疯狂了,让我非常震惊。在高维领域中,这种测量现象并不只存在于n维立方中原点与随机点之间的距离。尽管技术细节会因我们所研究的形状类型而有所不同,但这些都是概率论和更高维度空间之间深层次的神秘联系的表现。 总结 我们只是触及了一些惊人和奇妙的概念。我们发现我们在高维空间中遇到的一些奇怪现象与概率论有关。简而言之,我们在高维空间中观察到的许多古怪特征与我们投掷一堆硬币或掷一堆骰子时所看到的相似!我鼓励你们认真思考这个问题。因为我们是随机生成点,似乎很明显,我们期望随机变量和概率论以某种方式参与其中,但我们能想象它与这些更高维度空间的“物理”特征有如此根本上的联系吗?就是说,空间内随机点的集中传达了空间内体积分布的信息。在二维和三维空间中,我们可以依靠人类的感官来了解空间的物理特性。然而,当我们进入更高的维度时,我们必须依靠其他工具来理解我们的发现,我完全惊讶于概率论可以作为一个如此突出的工具来理解这些空间。我们已经一次又一次地看到,高维空间是绝对疯狂的,并且呈现出一些非常奇怪的特征,但我们还没有真正探究为什么会这样。坦白地说,我没有足够的知识来完全理解我们为什么会看到一些我们已经看到的东西。然而,这些问题,以及当我思考这些空间时,我所得到的奇怪但愉快的感觉,是我继续前进的动力。 赞 (0) 相关推荐 深度学习中的概率论与信息论基础 1.1 自信息 自信息(self-information),由香农提出,是与离散随机变量的值相关的信息量的量度,常用 bit 作为单位.通俗点来说就是一个随机事件以某个概率发生时携带的信息量有多大.可 ... 股价高维空间对低维空间的投影 在股市中想获得自由,就要获得意识能量的自由度.就是提升个人的维度,我们知道,一维是一条线,不怎么美,二维是一个面,可以画一幅画,对三维美感要比二维多无穷多倍. 所以,很简单的结论,每多一维,会增加无穷 ... 进入“心经”践行空间,开启高维实践通路 当你进入这个"心经"践行空间的时候,请放下手上的所有事情,在这一刻只是跟自己在一起! 你可能经常听到刘丰老师讲到的"高维"的理念,可能会经常问同一个问题:&qu ... 从2维空间到26维空间,“维度”如何影响我们的世界的? 我们的建筑.教育和字典告诉我们,空间是三维的.<牛津英语词典>将其定义为"一个自由的.可利用的或未被占用的连续区域或广阔区域--高度.深度和宽度的维度,所有事物都在其中存在和移动 ... 【总结】Oracle数据库 查看表空间和增加表空间 一.Oracle查看 表空间 的名称及其大小 查看 表空间的名称及其大小的SQL语句: ? 1 2 3 4 select t1.tablespace_name,round(sum(bytes/(102 ... 书法中的字内空间与字外空间 所谓空间,字典里的解释是"一切物质存在和运动所占的地方".书法由笔墨在纸上挥毫运动而成,在下笔之前,纸上没有任何点划,意味着没有任何"物质"产生,而一旦书家落笔 ... 什么是空间整理师?空间整理师如何就业? 什么是空间整理师?空间整理师如何就业? [文]张领域 整理师这个行业,如果领域学长没有记错的话,应该是从抖音上看到的日本主妇学习的一项技能,而且还是全民普及的技能,好像也不收费,不花钱,但是一切在国外 ... 《比利·林恩的中场战事》的空间叙事及叙事空间分析 <比利·林恩的中场战事>利用特定的叙事空间完成了特定的空间叙事,既关照了比利·林恩的个体心理情绪,又实现了个人情感.家国情怀与战争伦理的统一.同时,影片通过静态小空间的呈现,展示了比利·林 ... 奈雪的茶:高端现制茶饮龙头,“第三空间”打开增长新空间 除夕当天,奈雪的茶向港交所递交招股书,冲刺"新茶饮第一股".凭借出众的产品以及独特的店面设计,奈雪的茶通过用户朋友圈以及社交媒体的传播,很快成为高端现制茶饮的代名词之一.可以看到, ... 爱生活爱音乐!让耳机带你进入迷幻空间!舞度空间!PSYTRANCE! 爱生活爱音乐!让耳机带你进入迷幻空间!舞度空间!PSYTRANCE!