莱维分布——股票市场动态建模,揭穿股票价格的统计特性
在这篇文章中,我将分析股票价格的统计特性。我将首先说明,与大多数人的想法相反,收益的分布不是高斯分布。然后我将讨论莱维分布( Lévy distributions),它有很宽的尾部,因此在预测可能的崩溃和其他罕见事件方面更有效。最后,我们将讨论相关性。同样,与常识相反的是,在常识中,相关性从一开始就是零。真实的金融数据只有在某个时间间隔Δt*之后才变得不相关(在此时间间隔之前,它是一个衰减的指数函数)。
股票价格统计分析
股票价格的动态行为一般基于以下假设:
(1)交易的连续性意味着报价之间有一个非零的间隔
(2)价格演变为一个具有基本随机变量的随机过程
式1:描述股票价格动态的随机过程的随机变量。
它们既是独立的又是同分布的,且有有限均值μ和方差σ。
(3)ln S(t)的价格动态是一个扩散过程。扩散是指某一物体从其浓度高于其他大多数地方的地方“扩散”出来。
图1:扩散过程的示例。当隔板被移开时,溶质扩散,充满整个容器。
随机变量的增量被假定为高斯分布。这个模型被称为几何布朗运动(GBM)。GBM为下列随机微分方程(SDE)的解:
式2:描述GBM的SDE
其中W(t)为维纳过程或布朗运动,μ称为漂移,σ为波动性。解是:
式3:式2的解。
图2:显示了漂移μ变化时GBM的几个例子。
标准差σ(t)的指数接近0.5,这意味着价格变化是独立的。
根据式1,在有限区间内的报价总数是发散的。因此,根据中心极限定理:
具有高斯分布。
图3:通过对新的随机变量求和来“平滑”,原始分布密度收敛为高斯分布
我们应该模拟S(t)和一个离散时间的随机过程:
其中Δt为有限区间。物理学家已经对这些离散过程的性质进行了详细的研究。
股票收益
物理研究通常关注价格的变化而不是价格本身。如果 ΔS(n) << S(n), Δt很小并且价格变化缓慢,我们可以做出以下近似:
式4:随机变量的选择。
几何布朗运动的蒙特卡罗模拟比较:
图4:布朗运动的蒙特卡洛模拟例子。
用布朗运动的模拟:
使用年度漂移μ=10%,年波动率σ=20%和相同的正态分布随机数X(n),我们得到图X它显示出非常可靠的一致性。
图5:对每日现货价格S(t),几何布朗运动(实线)和布朗运动(虚线)的蒙特卡罗模拟的比较。漂移,波动,和选择的高斯随机数集是相同的。
因此,我们可以使用加法(而不是乘法)模型来计算股价:
式5:收益的加法模型。
在加法模型中,价格增量相加;而乘法模型中,连续的价格比率相乘。
一个数学插曲
莱维分布
式6:莱维分布。
是由法国数学家保罗·莱维( Paul Lévy)和苏联数学家亚历山大·金钦(Aleksandr Khinchin)提出的非负随机变量的概率分布。莱维分布考虑了峰度。
图6:高斯分布和莱维分布的比较。
莱维分布是一个稳定的分布,它意味着具有该分布的独立随机变量的线性组合将具有相同的分布。因此它们具有标度性:
式7:稳定分布具有标度性质。
图7:自相似过程的示例。
然而,莱维分布有不同的标准差。而且,它们的最大值更大更窄,我们知道这不会发生在真实的金融案例中。
图8:某股票日价差的对数与高斯分布的比较。尾巴是更宽的,它的最大值更大更窄。
这可以通过使用截断参数截断尾部来解决。一个截断莱维分布的例子如下:
式8:截断的莱维分布。
其中N是一个标准化常数。
图9:法国数学家莱维和苏联数学家金钦
曼德尔布罗特(Benoit Mandelbrot)是第一个注意到资产价格波动比高斯分布预测的更频繁的人,他们有大尾巴。
在一篇著名的论文中,H. E. Stanley和R.N. Mantegna利用1984-1989年的标准普尔500数据集来确定:
式9:股票变动的定义l。
图10:美国物理学家H. E. Stanley和意大利物理学家R.N. Mantegna
使用间隔Δt = 1,…,10^3min,其结果如下图所示。
图11:在Δt = 1分钟内,标普500的价格变化l与l/σ的概率分布。将高斯曲线(窄曲线)与莱维分布的最佳拟合进行比较。当l/σ≤6时,后者更好,但当l/σ≥6时,则呈指数下降。
以下莱维分布与l/σ≤6的数据吻合较好:
式10:莱维分布与l/σ≤6的数据吻合较好。之后,衰减是指数衰减。
莱维分布有两个主要的重要属性:
他们的稳定性(自相似性)
它们是概率空间中的吸引子
图12:识别稳定吸引子的收敛过程示意图
截断莱维分布在截断生效之前的很长一段时间内保持自相似。
相关性
几何布朗运动假定ΔS的相关性为零。为了验证这一假设,我们使用以下相关函数:
公式11:价格-价格相关性。
相关函数的值可以在区间[-1,1]内,但有三种情况是特别相关的,即:
如果1和2服从,则有:
式12:高斯过程的价格-价格相关性。
反之,式10从1到0呈指数衰减,且在较小时间内呈强相关性:
式13:价格-价格相关函数的指数衰减。
Δt* >15 时,我们得到了一个价格分布的候选方案。在Δt*之后,可以考虑一次价格变化为同分布的,分布为:
式14:当ΔS已经是同分布时, Δt* >15后价格变化的概率分布。
N*个因子的卷积累积分布为:
式15:式14卷积的累积概率分布
图13:标准普尔500指数与真实数据的累积概率分布。
我们注意到一些事情:
用α = 3/2 (c和λ拟合)截断的莱维分布可以很好地描述分布式14。
卷积很好地近似于t >> Δt*处的概率,但随着T的增加,卷积的形状收敛为高斯分布
随着T的增加,真实的金融数据跨越累积分布(在开始时低于它,在尾部高于它)
根据所分析的市场,高斯函数的收敛时间从几天到几周不等
继Stanley和Mantegna之后,我将快速分析道琼斯工业平均指数的动态。他们找出30只道琼斯指数股票的最大和最小相关系数。最大值是0.73,在可口可乐和宝洁之间,如图所示。
图14:可口可乐和宝洁ln S(t)的时间演变
他们还测量了强相关性保持强相关性的特征时间尺度。他们发现,从1990年到1994年,相关系数从0.73到0.51不等,这表明股票是高度同步的。