“超预期”策略是否能长期有效?(少数派投资)
最近有卖方出了一篇关于盈利超预期策略的报告,将相关的研究历史的龙去脉都交代清楚了。
1967 年芝加哥大学的Ray Ball 和PhilipBrown两位教授在首先提出PEAD(盈余公告后价格漂移Post Earnings Announcement Drift)效应后,预期外盈利异象受到了50 多年的广泛关注。
预期外盈利通常围绕上市公司盈余公告的披露展开,如果上市公司盈余公告披露后的最新盈利和基本面情况超过余公告披露前的预期值,那么就发生了超预期。我们之前研究的“净利润断层”策略只是PEAD效应中的一种。
回测数据
单纯的基于超预期因子中的分析师调升因子和研报标题超预期因子(总计八因子)来构建超预期事件股票池,该股票池长期年化收益27.86%。
如果选择叠加基本面因子来增强收益,叠加标准化预期外盈利因子,分档后股票池长期年化收益40%左右;叠加上下调比例差因子,分档后股票池长期年化收益42%左右。
如果选择叠加技术面因子来增强收益,叠加公告次日开盘涨幅-市场开盘涨幅因子(类似于净利润断层策略中的价格断层),分档后股票池长期年化收益42%左右。
如果选择叠加基本面与技术面因子(总计八因子),并采用打分制来增强收益,选取基本面得分最高的60只,组合从2010 年以来年化收益从基础的超预期事件股票池的 27.86%提升到35.26%;再选其中技术面打分最高的30只,组合从 2010 年以来年化收益从优选股票池的 35.26%提升到 44.9%。
为了强化年化收益率长期复利的惊人力量,我将年化收益率按5%的间距与投资本金十年能够增长到的倍数对应列了出来。
数据完美到不真实就会引起人们的警觉。回测结果实在太有悖于常识了,因为我们对客观的观察是:
过去十年中国A股市场公募基金过去十年年化15%的收益率已是百里无一;
长期徘徊在富豪榜之列的巴菲特坚持50余年的年化收益率不到20%;
如果能够坚持40%年化收益率,只要不到30年的时间就可以超越另外一位伟人——戴维斯,而其在40余年的投资生涯中总计录得18000倍的投资收益,这已经成就了其在投资史上的传奇。
究竟问题出在什么地方?
我首先想到的一个词就是“数据拷打”。
对于给定的样本范围与给定的时间段,只要你反复拷打数据,你总能够得到预期收益率。
问题在于:怎样区分正确的方法论与“数据拷打”之间的区别?
因果关系基础比率
得益于对行为金融学的学习,我在阅读丹尼尔.卡尼曼的《思考,快与慢》一书中似有所悟。
统计学基础比率是指某一事件所属类别的事实总量,与单独事件无关;而因果关系基础比率则会改变你对单独事件的看法。对两种基础比率,人们往往会区别对待。
统计学基础比率普遍受到轻视,当人们手头有与该事件相关的具体信息时,有时还会完全忽略这一比率。因果关系基础比率被视为个别事件的信息,人们很容易将这一比率与其他具体事件的信息结合起来考虑问题。
丹尼尔.卡尼曼认为,因果关系比统计学信息更具说服力,实践的结果也是依赖因果关系基础比率的研究才能获得令人满意的答案。
问题在于:
因果关系的判定是由系统1(直觉思维的快思考系统)处理的,而统计推理则是由系统2(严谨思维的慢思考系统)处理的,以致于人们在统计推理时可能并不清楚所用的统计信息是否与目标存在因果关系。而且由于表述或理解的微小不同以及情境的微小变化都可能对正确认知因果关系的形成干扰。
回到上述报告中,如果说基本面因子与股价的表现是有因果关系的,比如说:股价对未来收益的体现,那么技术面因子与股价则并没有因果关系。没有人可以说“因为股价上涨,所以股价会继续上涨”。因此,采用没有因果关系的技术面因子作为增强收益手段就是一个“数据拷打”行为。
回归平均值
归因错误还来自于另外一个现象:所有表现都会回归平均值。回归效应通常被人们误认为因果关系,而事实上它与相关性有关。
我们的思维常会对因果关系的解释带有很强的偏见,而且不善于处理统计数据。当我们把注意力集中在某一事件上时,相关的记忆就开始探寻其原因——更确切地说,我们会对所有早已存在于记忆中的原因进行自动搜索。当发现有回归效应时,因果关系解释就会被激活,但事实上这些解释都是不对的,因为回归平均值虽然可以用来解释现象,却无法找出其中原因。
即便提供了翔实的统计数据,我们的系统2(严谨思维的慢思考系统)在理解“相关”与“回归”的关系时仍然是相当模糊的,因为我们的系统1(直觉思维的快思考系统)总是要求我们对事物进行因果关系解释。因此,回归效应虽然随处可见,回归的概念却从来不显而易见。
达尔文的表兄高尔顿爵士用了好几年的时间才确定相关性和回归性并非两个概念,它们只是从不同视角对同一个概念作出的阐释。这个概念的原则很简单,但是影响却很深远:
只要两个数值之间的相关度不高,就会出现回归平均值的情况。
再回到上述报告中,我们说一下研报中的时间序列问题。任意两段时间内的股价表现相关性很低,这一时间段的界定是任意的,可以是一天、一周、一月、一年、十年或者其他固定间隔。由于采用了非因果关系的技术面因子进行了“数据拷打”,所以考察期内收益率数据表现优异。
然而,回归效应无处不在,也正是因为前十年的优异,下几个十年周期回归平均值将成为大概率事件。
因此,夹杂着非因果关系因子的超预期策略长期有效性是值得怀疑的。
结语
统计学家霍华德·维纳曾经列出过许多杰出研究者也犯过同样的错误——将相关性和因果性混淆在一起,这并非一个低级错误,而是与人脑的思维定式有关,有经验的人士都会小心提防这种毫无缘由的因果推论所形成的陷阱。正如罗伯特.希勒在《叙事经济学》中所说:
区分因果关系和相关关系是一个永恒的挑战。