随机矩阵理论,用于探索复杂系统的数学,从神经科学到量子系统
随机矩阵理论(RMT)利用统计力学的原理来模拟多个数学领域中复杂系统的交互作用。它最初被用于模拟重原子的核,后来被用于估计大量统计样本中的协方差,并预测著名的黎曼zeta函数零点的分布。更现代的应用包括理论神经科学和最优控制。
什么是随机矩阵?
顾名思义,随机矩阵是任意具有随机元素的矩阵,其元素为非负实数,且行和或列和为1。如果行和为1,则称为行随机矩阵;如果列和为1,则称为列随机矩阵;如果行和和列和都为1,则称为双随机矩阵。创建随机矩阵的一个简单方法是创建一个N × N矩阵,其中元素来自N(0,1)分布。然而,这个矩阵会有复数和重复的特征值。一般而已,实特征值才会有意义,特别是如果恰好有N个特征值。因此,我们将初始研究限制在对称矩阵的情况下,产生N个实特征值。这些矩阵称为高斯正交系综(GOE)中的样本,因此我们称它们为GOE矩阵。
创建一些这样的GOE矩阵并看它们的特征值,可以清楚地看到,当矩阵维数N增加时,特征值的“一般”大小也会增加。绘制每个N的特征值的平均大小将其形式化,表明特征值的大小与根号N成比例。
随机矩阵的特征值是如何分布的?
使用python生成一个大型GOE矩阵(N=5000)并绘制其特征值的分布产生了第一个有趣的结果。特征值的密度形成一个半圆。
以理论物理学家尤金·维格纳(Eugene Wigner)的名字命名的维格纳半圆定律是随机矩阵理论中最基本的结果,它证明了随机矩阵的特征值不符合我们的直觉。值得注意的是,这个半圆的边缘并不是自然地落在正负1上。特征值尺与根号N成正比的事实已经被用来对每个特征值进行归一化,即除以2倍根号N。
特征值之间的间距是如何分布的?
考虑一个GOE矩阵的两个连续特征值。它们的差值是均匀分布,正态分布,还是更复杂的其他分布?重要的是,间距为零的概率是多少,这意味着实际上存在小于N个特征值的情况?
使用相同的5000×5000矩阵,但这一次绘制连续特征值之间的间距密度会产生类似于移位的正态分布。
维格纳的推测。注意,虽然在这个图中看起来比半圆图中的条形要少,但是在s=3.5后有很多条形被忽略了。
1957年,在一次关于“中子物理”的会议上,与会者被问及原子核的能级间距可能是多少。维格纳从观众中走出来,在黑板上画了一条类似于上面红色那条的线。这个猜想被证明是非常准确的,这种分布被称为维格纳猜想。作为一个函数,维格纳猜想的极限可以写成:
在量子力学的背景下,维格纳猜想描述了一种叫做“水平排斥”的现象。空间约束系统中的粒子只能有离散的能量,称为“能级”。从一般意义上说,这些能级趋向于聚集,但也相互排斥。这导致了一种情况,即大多数能级之间的距离是相似的,任何两个重合的概率为零,任何两个s单位的间隔的概率随着s的增加而消失。这种分布也可以在栖息在电线上的鸟类或停在街上的汽车上看到。
通过研究N个特征值集合的联合概率密度函数,可以形式化经验分布的直觉:
很明显,负指数项最小化了大特征值的概率,而乘积项在最后(称为“排斥因子”)最小化了接近的特征值的概率。它也使相等特征值出现的概率为零。
上述联合概率分布函数的一个重要性质是,由于排斥因子,它不能因式分解。因此,不能假定特征值是独立的,即使GOE矩阵的元素是独立的。由于所有特征值都依赖于其他特征值,因此不能使用分析自变量的常用统计工具。
这些结果能应用于更高的维度吗?
如果上面的想法可以概括为两个维度,那么RMT随机矩阵理论可以应用于更广泛的问题。对称矩阵的复类比是厄米特矩阵,它等于它自己的共轭转置。为了从N(0,1)^2分布中提取元素,a和b从N(0,0.5)分布中提取,然后组合成a + ib的形式。所有具有这些元素的厄米特矩阵的集合称为高斯酉系综(GUE)。
除了一些缩放细节,GUE矩阵也遵循维格纳的半圆定律和猜想。这对于研究二维复杂系统是很有用的。甚至可以更进一步,使用厄米特四元数矩阵推导出三维的结果,但这远远超出了本文的范围。
随机矩阵的最大特征值是如何分布的?
随机矩阵的最大特征值的分布可以简单地集中在带有一定高斯或均匀噪声的维格纳半圆的边缘。然而,绘制1000个1000 × 1000矩阵的最大特征值对于GOE和GUE都产生了一个唯一的分布,由克雷格·特雷西和哈罗德·威多姆(Craig Tracy and Harold Widom)于1993年推出。
有趣的是,当维格纳半圆分布的边缘出现在1时,这条边在有限次迭代中的平均值处。这是由于计算限制。在文献中有很好的证明,该分布的收敛速度是O(N^(−2/3)),因此在更多的迭代中,我们期望均值趋于1。
Tracy-Widom分布通常定义为一个特定的潘勒韦方程的解。这是最严格的数学公式,但对于验证实际数据遵循该分布不是特别有用。可以找到其他的公式,包括矩阵行列式或积分的表达式,但这些会遇到相同的问题。获得y = f(x)型函数的最简单方法是使用数值近似。很明显,Tracy-Widom分布类似于伽马分布。为了估计所需的参数,将γ (k, θ)分布的前三阶矩与相应的数值结果进行了匹配。下图显示了与上面相同的数据(对于GOE情况),但是叠加了数值近似。这证实了,如果不是严格地,伽马分布可以是一个很好的近似的Tracy-Widom分布。
1972年,在Tracy和Widom发表我们今天看到的统计定律的20年前,生物学家罗伯特(Robert May )在一个相连的群岛上对陆龟种群进行建模。他想找出不同龟种种群的稳定性与岛屿之间联系的数量之间的关系。他发现的“临界点”是2倍根号N,正好是tracey - widom分布的峰值。1999年,Baik、Deift和Johansson发现,Tracy-Widom定律也描述了整数序列的变化,这是一个完全脱离自然的抽象系统。不久之后,这种分布在数学和物理中广泛出现。
最后,我们定义了两类随机矩阵,并讨论了它们特征值的一些基本性质。还有很多类型的随机矩阵。最值得注意的是Wishart-Laguerre集合,它可以帮助研究相关变量的系统。对于那些有兴趣学习更多关于随机矩阵的知识的人,我推荐利文( Livan )等人的《随机矩阵导论,理论与实践》。这是我所找到的关于这个主题最易读的介绍。后面的文章我将解释随机矩阵理论在金融中的应用。