金融数据概率分布
《我国股票指数收益的正态性分析》,2004年。两种指数的日收益率和周收益率不服从正态分布,而月收益率在一定的阶段表现出正态特性
《上海股票市场收益率正态性分析》,2005年,周收益率不服从正态分布
《我国混合型基金收益波动性分析》
《关于股票实际收益率呈正态的验证》
指数和个股对数收益率并不符合正态分布
我国股票市场收益率不服从正态分布,收益率分布呈现尖峰胖尾特征
一、备选方案
正态分布:属于细尾分布,或指数分布。峰度=3
T分布:当n=∞,为正态分布。属于低峰肥尾,和尖峰态的尖峰肥尾、低峰态的低峰瘦尾都不相同。
肥尾分布(Fat-tailed distribution),峰度>3。尖峰分布有大大的尾巴,称为肥尾。分为:尖峰肥尾、低峰肥尾
瘦尾分布或细尾分布(thin-tailed distribution),峰度<3。平峰分布的尾巴很小,称为瘦尾。分为:低峰瘦尾、尖峰瘦尾
尖峰肥尾
二、峰度和偏度
1、峰度又称峰态系数,表征概率密度分布曲线在平均值处峰值高低的特征数。表示分布的尾部与正态分布的区别
峰度=0表示该总体数据分布与正态分布的陡缓程度相同;
峰度>0表示该总体数据分布与正态分布相比较为陡峭,为尖顶峰;峰度<0表示该总体数据分布与正态分布相比较为平坦,为平顶峰。
2、偏度(Skewness),偏度是数据的不对称程度
偏度=0表示其数据分布形态与正态分布的偏斜程度相同;
偏度>0表示其数据分布形态与正态分布相比为正偏(右偏),即有一条长尾巴拖在右边,数据右端有较多的极端值,数据均值右侧的离散程度强;
偏度<0表示其数据分布形态与正态分布相比为负偏(左偏),即有一条长尾拖在左边,数据左端有较多的极端值,数据均值左侧的离散程度强
A股市场呈现出比较明显的左偏特征
三、方案介绍
1、正态分布
2、对数正态分布
设Si为资产第i日的价格,则资产的对数收益率ui=ln(Si/Si-1)
假设日对数收益率ui服从正态分布
ds/s=μdt+σdB(t)
数学期望,E[lnS(t)]=S(0)+(μ-σ^2/2)*t
方差,D[lnS(t)]=σ^2*t
说明:表明股票价格的lnS服从方差为σ^2*t的正态分布,或股票价格服从对数正态分布。
3、t分布
形状与标准正态分布相似,但峰比的N(0,1)峰低一些,两侧尾部厚一些。
随着自由度n的增大,t分布与N(0,1)之间的差别就越来越小,自由度为10的t分布已很接近标准正态分布
4、尖峰肥尾
金融数据的尖峰厚尾特征是相比较标准正态分布来说的,标准正态分布的偏度为0,峰度为3,通常做实证分析时,会假设金融数据为正态分布。
但是实证表明,很多数据并不符合正态分布,而更像尖峰厚尾,就是峰度比3大,两边的尾巴比正态分布厚,没有下降得这么快。
厚尾分布主要是出现在金融数据中,例如证券的收益率。较正态分布图的尾部要厚,峰处要尖。
就是这些数据出现极端值的概率要比正态分布数据出现极端值的概率大。一般来说,通过实证分析发现,自由度为5或6的t分布拟合的较好。
实证结果表明:我国股价波动具有尖峰厚尾特征、异方差性特征和波动的持续性和非对称特征。
5、幂律尾(Pareto)
P(X>x)=(x/xmin)^k
金融产品的共同特点: 短期市场总是过度反应,收益率服从幂律尾分布,长期则回归理性,收益率逐渐向正态靠拢。
回撤尾部满足帕累托分布
四、统计数据
上证指数,数据时段:2000.1.4-2015.11.19
总天数:3841
正收益天数:2032(52.85%),负收益天数:1808(47.15%)
最大日盈利:9.4%,最大日亏损:-9.3%
平均日收益:0.0253%
正收益平均日盈利:1.104%,负收益平均日亏损:-1.187%
红线:理论正态分布曲线。绿柱:市场实际日对数收益分布率
结论
市场实际分布率并不符合理论正态分布,表现为以下几点:
1、正收益分布与负收益分布概率不对称。2、平均正收益与平均负收益也不对称
3、在均值正负0.5sigma区间内:实际分布概率明显高于正态理论分布概率。
4、在-3.5到-0.5sigma,0.5到3.5sigma区间内:实际分布概率明显低于正态理论分布概率。
5、在3.5sigma以外的区间:实际分布概率远高于正态理论分布概率