国内公募基金的羊群效应研究

封面:西安大雁塔
牛年第一天先给大家拜个年,九号线祝各位朋友们在新的一年事业进步、业绩长虹、阖家幸福,买到牛基!!我也将继续努力给大家提供更多更好的研究内容!!
今天聊聊当下一个热门话题——公募基金的抱团现象,或者说羊群效应(Institutional Herding)。
根据之前的研究结果,由于投资者的社会背景(诸如校友圈、老乡圈、ClubHouse等,参考申宇等《校友关系网络、基金投资业绩与“小圈子”效应》),机构所处地理因素(诸如北上广深不同投资圈子、浦江会等,参考Hong等《The Neighbor's Portfolio: Word of mouth Effects in the Holdings and Trades of Money Managers》)以及上市公司自己的核心区圈(茅台核心圈、隆基股份核心圈、宁德时代核心圈等)等原因,甚至仅仅因为相对排名考核的原因(参考路磊等《基金排名变化和羊群效应变化》),基金经理会采用与其他投资经理人相同的投资决策以降低投资成本和声誉风险,从而引起证券市场上集中买入或卖出某些股票的现象,并由此造成所谓的抱团现象。
 
虽然公募抱团早已不是新鲜事,但最近一两年A股市场抱团现象愈演愈烈:散户买股票不如买基金——基金被申购继续抱团重仓——持续买入重仓股导致公募基金业绩更好——进一步申购,如此循环反复引起了很多人、甚至监管层的担忧。。。

本文试图在前人的研究基础上,简单分析国内公募基金是否存在明显抱团现象?抱团能否提升业绩?谁在抱谁的团?给大家春节期间无聊漫长的假期带来一丝惬意。
一、文献综述
较早研究机构投资者羊群效应的是Lakonishok、Shleifer、Vishny1992年提出的一种基于统计学的基金经理羊群行为分析方法(简称LSV),该方法核心是观察特定群体投资者的交易模式来发现是否存在同时买卖的倾向,该方法衡量羊群效应的统计量H 如下:
其中p_i,t为t时刻市场上买入股票i的机构投资者数量,AF 是调整因子。之后Vivek Sharma等人运用LSV方法验证了2000年美国互联网科技泡沫时期,证明无论买入还是卖出,均存在显著的机构羊群效应。不过该方法存在一个问题:仅考虑市场上买卖某股票的机构投资者数量,没考虑买卖的股票数量。
接着,2018年基金研究领域大神Hao Jiang在《Does herding behavior reveal skill?An analysis of mutual fund performance》一文中提出了一个基于股票买卖数量的机构羊群效应测算方法,模型如下:
其中Trade_i,j,t表示t期,基金j在股票j上相对t-1期的投资数量百分百变化,Delta IO_i,t-1表示t-1期,市场上所有基金在股票j上相对t-2期的投资数量百分百变化。该模型是一个截面回归模型,回归系数β_j,t越大越显著说明基金j的羊群效应越明显,反之则反然。
注意这里的下标说明该模型是一个跨期羊群效应——机构投资者参考上期别人的股票持仓而作出的变化,与之对应的是同期羊群效应——机构投资者参考当期别人的股票持仓而作出的变化。

Hao Jiang等人运用美国市场公募基金数据得到的结论是:基金羊群效应会对其业绩有负向预测性,即越从众的基金未来收益表现越差,且无论采用普通收益率、净收益率、因子剥离alpha等作为收益指标,都得到一样的结论。 
鉴于上述Trade和Delta_IO指标的计算公式中,分母不能为0,因此基金首次持有某只股票的情况将无法被捕捉,而在实际投资中这一情况并不罕见。国内中泰证券的包赞运用了改进版的Trade和Delta_IO计算公式,

此处Trade_i,j,t定义为t时期,基金j持有股票持仓额的变动占t-1时刻j基金整体股票持仓额的百分比变化。其中mkv_i,j,t 代表t时刻基金j对于i股票i持仓额,mkv_j,t-1代表t-1时刻,基金j的整体股票持仓额,Delta_IO同理。这样就可以避免本期新增持股无法考虑进来的问题。包赞运用国内公募基金的数据进行分析得到的结论是:不同于美国市场,国内最从众的百分之二十基金组合(羊群基金)及最反从众的基金组合(反羊群基金)表现最为优异

不过我认为这个方法还是有问题的:1、基金持有某股票数量的变化可能是由于净申购带来的被动等比例增持,而非羊群效应或者自己进一步看好该股票;2、即使考虑了改进后的市值变化,也没要考虑股票的分红转股情况(由于分红导致的某股票持有规模下降,并不意味着减仓行为);3、Delta_IO的计算是全市场基金的简单平均,首先应该剔除自身、其次不能简单平均(管理1000亿规模的张坤加仓某股票带来的效应,同管理规模仅几亿的基金加仓某股票带来的效应不可同日而语,管理规模加权比简单平均更合理)。

最后推荐一篇最新发表的文章:来自西南财经大学罗荣华教授的《“和而不群”还是“卓尔不群”?———基于基金网络信息使用的视角》,罗教授也是国内基金研究领域的资深专家了,他的文章经常看。

在该篇论文中,作者首先定义了基金网络:如果两只基金重仓持有相同的股票( 占各自仓位的5%以上) ,即认为两只基金彼此之间存在关联。我们定义基金J 的网络N( J) 为与它存在关联的其他基金的集合。这里N( J) 中不包括与基金J 在同一家基金管理公司的基金。(关于基金网络,公众号此前也写过一篇文章《机构投资者(基金)交易行为传染性研究》)

接着作者构建一个网络偏离度指标用来衡量基金偏离网络内其他基金平均水平的程度:

H_i,j,t为基金j在t期持有股票i的数量,则Delta_h_i,j,t就是基金在t期持有股票j相对于t-1期的变化,同时考虑了股价(P_i,t-1)、分红转股(adfactor_i,t)以及基金的管理规模Marketvalue_j,t-1的影响。这里的DFN指标越大,说明基金偏离网络平均水平越远,基金持仓结果越独立。值得注意的是这篇文章检验的是基金同期网络效应而非跨期网络效应,前面说过这是两个概念。

接着作者运用下列模型检验基金的网络偏离度和基金未来业绩(FF4因子模型调整后alpha)的关系:

结论意料之中,无论是模型1(仅控制基金特征)、模型2(加入基金经理特征)还是模型3(加入基金所在网络特征),DFN前回归系数均显著为负,说明DFN越大的基金,即基金持仓结构越独立(非抱团基金),基金当期的表现越好。

另一方面,作者考虑到若基金网络内基金的一致性交易行为并非出于私有信息的共享,而只是基金羊群行为的一种体现,那么根据基金交易行为与网络内其他基金平均交易行为的偏离所构建的DFN指标衡量的就不是网络信息使用程度而是部分羊群行为。

为了进一步确认羊群行为对基金持仓的影响程度,作者又构建了一个DFC( DeviationFrom the Crowd) 指标来控制基金整体的羊群行为。DFC 的计算公式如下:

DFC和DFN的区别仅仅在于它统计了除基金j以外的所有基金(而非基金j网络内的基金)在某只股票i上的相邻两期持仓变化。
可以看到,DFC指标系数显著为正,表明基金交易与其他基金的交易偏离越远,即较少从事羊群行为的基金在下一期能够获取更高的超额收益,该结论与Koch(2017)、Hao Jiang(2018)等运用美国市场公募基金数据得到的结论一致。同时加入了DFN 指标和DFC 指标后DFN 指标的统计显著性下降很多,基金网络效应明显受到基金羊群效应影响(似乎是常识),但DFN指标仍然显著为正,表明控制了基金羊群行为后DFN指标仍然含有反映基金经理能力的增量信息。
最后,由于DFN指标与DFC指标是高度相关,因此作者将每期DFN指标对DFC指标进行横截面回归,将所得残差Residual即DFN中不能被DFC所解释的部分带入模型,Residual系数显著为正。再一次证明DFN即基金对网络内信息的使用程度能够反映出基金经理的管理能力,且该指标越大(偏离网络平均越远)未来超额收益越高。
文章最后作者还做了一个有意思的检验,记得之前写过一篇文章《股票相关性的截面分化度与主动股票投资的价值》,即股票市场整体分化度越大,越能发挥主动管理的价值。同样的思路,作者构建了市场分化度指标:
然后验证在不同市场分化度背景下,DFN指标和基金业绩的关系。结论不出所料,DFN 指标与基金业绩在市场收益高度分化时更加陡峭,表明高市场分化度背景下DFN更可能体现基金经理的能力,主动管理的价值更大!!!
二、本文研究方法

下面打算在A股市场简单验证下,综合参考了罗容华和Hao Jiang使用的指标,不过稍微做了点改进:

1、P_i,t-1改为P_i,t,其实更严谨的是t-1~t期的平均价格,因为我觉得t期末基金对股票i的持仓更受股票i当期价格影响;

2、因为是研究羊群效应,我这里不再计算基金网络,而是用除自身以外的全部基金计算整个市场对股票i的操作变化;

3、全市场基金对股票i的操作变化,采用管理规模加权平均而非简单等权,理由前面解释过。


此处目标是验证基金的当期羊群效应,因为随着互联网微信普及,现在的信息传递渠道非常发达,根本不需要等到定期报告滞后公布,大家就能知道其他基金经理或者市场在买卖哪些股票。
接着每一期对单个基金进行横截面回归,由于此处计算持仓变化用的是分红转股调整后的股票数量变化而非市值变化,所以模型中没考虑股票本身的涨跌幅影响:
这里β系数越大且越显著,说明基金的抱团效应越明显,反之则反然。所以本文定义的基金抱团指标(或者羊群效应指标,都一样)即上述回归方程中β的T值。
三、数据说明
    
样本基金是全部主动管理权益基金,即WIND普通股票基金+WIND偏股混合基金+WIND灵活配置基金,并按如下标准进行筛选:
1、为了剔除主题基金投资领域限制的影响,仅考虑基准为沪深300、中证500、中证800、上证综合指数、MSCI中国A股指数等宽基指数为业绩基准的基金;
2、剔除沪港深基金或可以投资港股的基金,仅考虑A股市场的羊群效应,不过由于基本是同一批基金经理管理,对于可投沪港深股票的基金结论应该类似;
3、剔除FOF基金、剔除打新基金以及剔除样本期间内股票平均仓位低于50%的基金;
4、由于我国基金每半年披露全部持仓,一季报、三季报仅披露10大重仓股,因此数据频度均取半年度;
5、保留了量化基金,我的概念中量化基金本质也是主动管理基金(区别于指数基金),只不过把投资策略固化了而已;
6、为了剔除建仓期影响,每一期均选取成立已满半年以上的基金,由于基金2020年报还没有公布,所以一共使用了2015年报~2020半年报10期数据

四、实证结果分析
首先看一下基金抱团指标的描述性统计。整体来看,至少2016年以来公募基金的抱团指标平均值都在2以上,呈现明显的羊群效应即基金当期抱团现象还是很明显的。这个也容易理解,这几年随着信息传播渠道越来越多,每家机构的核心股票池基本上都差不多,半年内加减仓节奏也基本同步(可能会有月度级别的时滞,部分机构早于其他机构知道一些信息)。
从时间序列角度看,虽然平均抱团指标(回归系数的T值)2017年6月后有所下降,2019年年底有所反弹,但统计显著性仅表明回归结果不是由于抽样误差导致,所以只要它们均统计上显著(大于1.65即对应10%的显著水平)并不影结论:即公募基金市场整体存在抱团效应。
接着将基金根据抱团指标从低到高分为5组(a组抱团指标最低,e组抱团指标最高),验证抱团指标和当期基金收益率(这里偷懒没有用FF5因子剥离alpha而是直接用了收益率)之间的关系,可以发现很有意思的现象:
2016、2018年市场熊市期间,抱团指标高的基金组(group e)表现更差,2016年平均低4.5%~5.6%、2018年平均低2.7%~3.6%。而2017、2019以及2020上半年这种牛市行情中,抱团指标高的基金组表现更好,尤其是2019年下半年以来,e组平均收益要比a组高5%+,而且我相信2020年报出来后进一步统计的话,这个结论依旧成立。
由于基金经理更换会导致基金投资策略的变化,甚至同一基金经理不同时期也会采取不同的抱团策略,所以我们发现基金的抱团指标不同时期也会显著不同。比如下面这个基金,抱团指标从前几年的显著为正到近几年显著为负,而且该基金2019年后更换了投资经理。
我看了下该基金2020年中报的持仓,果然很非主流:没有白酒、没有食品、没有新能源,重仓的医药股也是非主流品种,不用说在这个抱团的时代业绩应该不会特别好。
最后整理了一下基金经理管理满5年时间的基金,统计从201606~202006以来共9期基金抱团指标。前50和后50我标出了,版面原因把中间的部分基金省略了。
必须强调的是,过去几年平均抱团指标高的基金业绩都挺好,但过去几年平均抱团指标低的基金也有业绩好的虽然不多,这个有一句说一句,比如泓德远见回报、鹏华策略优选、嘉实优质企业。
五、参考文献:
1、Choi,Nicole and Richard Sia:《Institutional Herding.》
2、Hao Jiang and Michela Verardo:《Does herding behavior reveal skill?An analysis of mutual fund performance》
3、Vivek Sharma,John C. Easterwood and Raman Kumar:《Institutional Herding and the Internet Bubble》
4、The Neighbor's Portfolio:《 Word of mouth Effects in the Holdings and Trades of Money Managers》
5、罗荣华、田正磊和方红艳:《“和而不群”还是“卓尔不群”?———基于基金网络信息使用的视角》
6、中泰证券包赞:《基金持仓羊群效应与基金业绩分析》
7、申宇、赵静梅和何欣:《校友关系网络、基金投资业绩与“小圈子”效应》
8、路磊、黄京志和吴博:《基金排名变化和羊群效应变化》
(0)

相关推荐