【香樟推文2175】负责任的投资:ESG的有效前沿
原文信息:
Pedersen, L. H., Fitzgibbons, S., & Pomorski, L. (2020). Responsible investing: The ESG-efficient frontier. Journal of Financial Economics.
01
研究背景
在Merton(1987)之后,关于ESG的理论文献越来越多,并假设对ESG信息敏感的投资者拒绝持有某些资产。例如,Heinkel et al.(2001)、Luo和Balvers (2017)和Zerbib (2020)都表明,在均衡状态下,这种市场分割会导致非绿色企业获得更高的预期收益。学术界和投资者对ESG是否有助于或损害他们的预期收益的意见大相径庭。一些人认为包含对ESG的考虑必然会降低预期收益(Hong和Kacperczyk,2009),而另一些人则认为“基于ESG的投资策略有出色表现是毋庸置疑的”(《金融时报》,2017)。为了调和这些对立的观点,作者提出了一个理论,阐明了基于ESG投资的潜在成本和收益。作者的理论解释了ESG策略如何影响投资组合的选择和资产价格均衡。
本文的研究整合了那些认为ESG会损害投资组合收益的文献和那些得出相反结论的文献之间的不同点。前一组基于分割理论(segmentation theories),通过实证证明了有罪股票(sin stocks)产生正的超额收益。这种有罪溢价与Baker et al.(2018)的发现相似,即“绿色市政债券相较于其他类似的普通债券是溢价发行的”。后一组的文献中,如Gompers et al.(2003)证明了,具有良好治理水平的股票(即ESG中的G)会产生正的超额收益,员工满意度较高的股票也会产生正的超额收益(Edmans,2011)。本文所建立的模型和实证结果有助于解释这些相反的发现。作者认为,如果ESG是未来企业利润的积极预测因素,并且ESG的价值在市场上没有完全定价,那么ESG就可以正向地预测收益。此外,本文的模型还预测了,当大多数投资者看到ESG中的价值甚至反转信号时,ESG就成为中性的收益预测因素。当投资者对于高ESG分数的股票,愿意接受其较低的收益率时,ESG就成为收益的反向预测因素。因此,根据本文所构建的模型,Hong和Kaperczyk(2009)的结果之所以较为显著,是因为他们对有罪股票(与酒精、烟草和游戏相关的行业)的衡量与投资者需求较低有关,而Gompers et al.(2003)和Edmans (2011)的ESG指标衡量与更高的公司利润相关,但市场还尚未充分认识到这一点。
本文还涉及到了歧视经济理论(economic theories of discrimination),其中包括Becker(1957)提出的基于偏好的歧视理论(taste-based discrimination)和Phelps(1972)提出的统计歧视理论(statistical discrimination)。事实上,ESG分数在本文的模型中扮演着双重角色,因为ESG直接影响投资者的偏好(一种基于偏好的歧视理论),也间接影响风险和预期收益(一种统计歧视)。在这两个维度之间,存在着各种相互作用的潜在输出。这种灵活性十分重要。因为有些ESG衡量指标对收益的预测是正向的,有些是负向的。只有有着灵活性的ESG理论框架,才可以通过每种方法进行可检验的预测。
研究内容
02
作者考虑了三种类型的投资者。U型投资者对ESG分数不感兴趣或不了解。U型投资者假设超额收益为E(r),风险由方差-协方差矩阵给出的var(r)所表示。A型(了解ESG)投资者使用ESG分数来衡量风险和预期收益。A型投资者用资产的期望值表示超额收益μ=E(r|s),以ESG信息s为条件,并使用超额收益的条件方差协方差矩阵Σ=var (r| s)来衡量风险。M型投资者 (受ESG激励)使用ESG信息,也对分数较高的ESG有偏好。U型和A型投资者的投资组合问题有标准的Markowitz解,所以本文重点讨论M型投资者的投资组合解。
本文只考虑投资组合多头端的头寸不少于空头端的头寸,是因为很难为整体上以空头为主的投资组合定义总体ESG特征,但原则上,可以更广泛地应用该框架。
在标准的均值-方差分析中,投资者最好将切线投资组合与无风险证券相结合。切线投资组合是最大化夏普比率的投资组合,即预期超额收益除以超额收益的标准偏差。为了更好地找到理想的投资组合,作者考虑了每个ESG分数级别的最大SR。当ESG分数为时,可获得的最大SR可以表示为ESG-SR前沿:
为了针对每个ESG水平计算最高的夏普比率,作者对效用最大化问题公式进行了重写。
这个表达式意味着投资者的问题可以被认为是首先选择给定风险水平σ和ESG分数的最佳投资组合,然后再对σ和取最大值。对于给定的ESG分数,选择具有较高SR的投资组合可以解决前一个问题,从而得出:
风险的最优水平由σ= SR ()/γ给出。在命题1中,插入这个风险级别并简化表达式可得到结果。
命题1 (ESG-SR权衡):
投资者会选择平均ESG分数,以使下列函数最大化:
这个命题展示了投资者如何最佳地权衡ESG和夏普比率。关于投资组合决策的选择是基于风险厌恶的,因此,ESG-SR前沿可以独立于偏好计算,投资者最终可以决定其投资组合在前沿所处的位置。
理解ESG-SR前沿需要明确区分风险厌恶的不同和对ESG偏好的不同。相互影响(Interaction effects)也是存在的。如果一群投资者同样程度地关心ESG分数,但他们的风险厌恶程度不同,那么一个风险厌恶程度较高的投资者不仅在无风险资产上投入更多资金,而且他还将向更高的ESG和更低的SR水平倾斜。从经济上来说,这种相互影响是因为当投资者更厌恶风险时,SR就变得不那么重要了(因为投资者知道他们无论如何都会承担较少的风险),因此,相对而言,ESG就变得更加重要。
命题2 ESG-SR前沿:
命题3 四基金分离(four-fund separation):
给定平均ESG分数,最佳投资组合为:
命题4 带筛选的ESG-SR前沿:
命题1的结论对任何圆锥形的X都成立。
一些投资者使用筛选来实现其ESG投资组合的抉择。作者通过将允许的投资组合设置为
,来更直接地总结此类筛选。Zerbib(2020)模型还结合了ESG偏好对筛选进行了建模,并通过实证研究来分析其结果。一些投资者增加纯多头限制,即排除空头头寸。如果允许投资者做空,投资者可能会进行更好的风险-收益权衡。此外,做空低ESG股票的效果与偏好ESG的效果可能是一致的。因此,投资者可能要求他们在低ESG股票中的头寸为零或者为负值,即,
。所有这些投资组合集都是“圆锥形的”。这里的圆锥形指的是:对于X中的任意元素x,以及任意a>0,可以得到ax属于X。
命题5 广义ESG-SR前沿:
如果投资者有广义的ESG偏好e(x,s),那么投资者关注的问题是:
在解决了ESG投资者的Markowitz问题后,需要内生地求出证券的价格和收益。作者首先考虑了一个世代交叠模型OLG(overlapping-generations)经济。每一时期,都有新的投资者出现,U型投资者是以财富Wu为初始禀赋进入市场的,A型和M型投资者类似,总财富就是W=Wu+Wa+Wm。投资者生存一个时期,且市场清算要求所有新的投资者对股票的总需求等于所有流通股股数。
命题6 :
如果所有投资者都不知道ESG信息即都为U型投资者,那么任何证券i都有稳态均衡价格(steady-state equilibrium price):
无条件的预期收益服从标准的无条件资本资产定价模型:
有条件的预期收益则由以下公式所决定:
作者关注的是稳定状态的均衡,其中价格是常数。之所以存在这种稳态均衡,是因为股息随时间是独立同分布的,ESG分数是常数,不同投资者类型的财富是常数。如果不做这些假设,每个证券价格将取决于其当前的ESG分数和当前的投资者ESG情绪,从而导致产生有趣的变化。例如,一种证券的收益差异也会取决于整个ESG投资者情绪变化的风险、股票自身ESG分数的变化、ESG预测股息方式的变化(例如,由于客户对绿色产品需求的变化)以及所有冲击的协方差。本文为了简化将着重关注稳态。
命题7 ESG-CAPM:
如果所有投资者都是受ESG激励的M型投资者(Wu=Wa=0),那么任何证券i都具有均衡价格:
如果所有投资者都是A型投资者,则相同的结论成立,且π=0。
命题7表明,当所有投资者从ESG信息中获得效用时,相对于由忽视ESG的投资者主导的经济(如命题6所示),均衡资产价格是不同的。有了这样的ESG动机的投资者,任何公司的股票价格都从两个方面受ESG分数的影响。首先,ESG分数会影响预期的现金流。其次,较高的ESG分数会降低分母中使用的贴现率,从而提高价格
综上所述,作者根据其理论做出了以下预测:
1.风险、预期收益和ESG之间的权衡可以用ESG-SR前沿计算得到。
2.利用ESG信息可以通过改善ESG-SR前沿来提高投资者的SR。
3.鉴于投资者的信息集,具有较强ESG偏好(或较高的风险厌恶)的投资者会选择具有较高ESG得分和(略微)较低SR的投资组合。
4. 即便是偏好平均ESG分数的投资者,也会最优地选择在几乎所有证券中都具有头寸(多头或者空头)的投资组合(相对于偏好的歧视性的标准模型所隐含的更严格分离要求而言)。
5. ESG投资者选择四种投资组合(或基金):无风险资产、标准切线组合、最小方差组合和ESG切线组合。
6. ESG分数较高的证券应该具有以下几点特征:
a.ESG投资者的需求增加,将会降低该证券的预期收益;
b.不同的预期未来利润,如果市场对基本面的这种可预测性反应不足,则可以提高预期收益;
c.潜在的来自投资者的更多的资金流,可能会在短期内提高证券价格
03
指标选取
由于ESG是一个宽泛的术语,本文仅考虑四个指标,它们涵盖了ESG的不同方面。本文的目的不是在它们之间进行对比,而是讨论市场会如何对ESG的不同因子定价,并以此举例说明本文的理论模型如何为ESG投资者提供指导和帮助。
本篇论文所使用的四个ESG变量指标如下:
(1)环境(E)的度量:低碳强度(low carbon intensity)。作为衡量一家公司绿色程度的指标,本文计算了其碳强度(二氧化碳),其被定义为以千吨为单位的碳排放量与以百万美元为单位的销售额之比。碳排放量可以通过不同的方式进行衡量,本文选用的是“范围1的碳排放量”(公司的直接排放量)和“范围2的碳排放量”(购入能源的间接排放量)。本文不包括“范围3”(其他间接排放量),因为这些排放量很少被公司报告,且对于不同数据供应商的估计是不一致的。本文在二氧化碳变量前加了负号,以使更高的因子值表示更好的ESG水平。
(2)社会(S)的度量:非罪恶股票(Non-sin stock)指标。一些对ESG敏感的投资者会避开某些行业的股票,例如烟草、赌博和酒精。本文考虑了一个非罪恶股票指标,对于有罪股票,取值为0,否则取值为1。此指标越高表示ESG分数越好。
(3)治理(G)的度量:较低的应计利润(Low Accruals)。本文使用了一种在一个较长的样本期内可以根据会计信息进行计算的治理指标。本文以每个公司在1963年1月至2019年3月期间的应计资产项目为样本进行观察。本文在应计利润前加负号,以使较高的因子值表示较高的ESG分数。阅读相关的会计文献可以发现,应计利润低表明企业对利润的会计处理是较为保守的(Sloan, 1996),而治理较好的公司则倾向于采用更为保守的会计处理(Kim et al., 2012)。研究表明,受到美国证券交易委员会(SEC)强制执行措施的公司在采取此类措施之前往往拥有异常高的应计利润(Richardson,Sloan,Soliman和Tuna,2006),而拥有高应计利润的公司拥有更高的利润重述可能性(Richardson,Tuna和Wu,2002)。
(4)整体ESG的度量:MSCI的ESG分数。机构投资者最广泛使用的ESG分数之一是由MSCI计算的得出的,该变量的样本是从2007年1月到2019年3月。MSCI分数是对每个公司的ESG概况的综合评估。本文在行业调整的基础上,总结每个公司的E、S和G特征的分数,评分范围为从0(最差ESG)到10(最优ESG)。
本文将上述的数据及与以下相关数据和模型结合使用:XpressFee数据库(股票收益和市场价值)、Compustat数据库(计算公司基本面)、13f持仓报告中的机构持仓头寸(由Thomson Reuters汇总)、根据日内数据计算得到的下单量,和用于计算ESG有效前沿的Barra US Equity(USE3L)风险模型。
为了计算ESG-SR前沿,投资者必须首先选择他们的投资领域,并计算风险和预期收益。本文考虑了标准普尔(S&P) 500指数中股票的月收益。为了计算风险(即标准普尔500股票的方差协方差矩阵),本文假设所有投资者都使用Barra US Equity(USE3L)风险模型。不了解ESG的投资者和了解ESG的投资者以不同的方式计算预期收益。U型投资者关注一般的股票风险溢价和市价比率等的传统价值衡量指标,而A型投资者则使用ESG信息来进行投资决策。
图5显示了使用G指标下的ESG有效前沿。不了解ESG的投资者的前沿与了解ESG的投资者的前沿有很大不同。这种差异的出现是因为本文的G指标预测了样本的收益。在图5.A中不了解ESG的U型投资者在ESG得分为0.25时使夏普比率最大化,这意味着U型投资者的投资组合中的样本股票接近该ESG衡量指标的平均值。这里所提到的ESG几乎是中性的,因为U型投资者只使用市价比率(book-to-market ratio)的信息,而对G的任何敞口都只是偶然地通过市价比率和G之间的弱相关性所产生的。此外,前沿在零附近相对对称,这意味着该投资者认为以正的G分数为目标的成本与以同样幅度的负分数为目标的组合成本相似。
图5.B显示了A型投资者的已实现的前沿(Realized frontier)与事前感知前沿(Ex ante perceived frontier)形似。这是因为驱动前沿的ESG分数被明确纳入了面板A的收益预测,并且因为本文的事前风险和期望收益模型很好地捕捉了事后已实现收益。图5.B中的U型投资者的已实现前沿与面板A中的感知前沿具有不同的形状,这是因为U型投资者忽略了G指标可以预测收益。U型投资者的已实现的ESG-SR前沿看起来与A型投资者的前沿类似,这是因为他们的投资组合在该范围内更相似。除此之外,U型投资者选择的投资组合是在市场敞口、价值和G分数之间进行了次优权衡。
主要结论
04
结论1.筛选出最差的ESG股票,可以建立最优投资组合
前文的实证研究允许投资者在不受约束的投资组合中配置他们的资本,在投资领域做多做空任何股票。下文要考虑对ESG敏感的投资者(ESG-sensitive investors)面临的现实限制和限制条件。在这些约束条件中,最普遍的是筛选出具有最弱ESG特征的股票。图6显示了三个不同的ESG-SR有效前沿:第一个是无约束投资者A,第二个是投资者剔除掉具有最低ESG特征的10%的股票,第三个是剔除掉具有最低ESG特征的20%的股票。
观察图6可以发现,当剔除表现最差的ESG股票时,夏普比率最高的投资组合的ESG分数较低。无约束条件的投资者A在投资组合的ESG分数为2.25时,夏普比率得到优化。当剔除10%的ESG最低的ESG股票后,夏普比率在ESG分数为1.5时达到最大;剔除20%后,夏普比率在ESG分数为1时达到最大值。
因此,与那些允许在投资组合里包含这些有较低ESG分数资产的投资者相比,将低ESG资产剔除在投资组合之外的投资者,更有可能以较低的ESG分数建立最优投资组合。这一发现背后的逻辑是,低ESG资产是有效的融资来源,允许不受约束的投资者做空它们,以建立更大的高ESG分数的证券多头头寸。此外,低ESG资产可以作为高ESG资产的有效对冲工具,并可能通过增加对高ESG证券的投资来帮助投资者提高整体投资组合的夏普比率。通过筛选,投资者可以最优地选择不让高ESG分数的资产在组合中占据过大的头寸。
结论2.ESG可以预测未来的基本面
ESG信息能够产生正的超额收益的一个必要条件是它与未来基本面相关。为了测试这种可能性,作者将其ESG指标与未来的基本面联系起来。作者考虑表1中的两个基本面指标。表1.A中考虑了“会计收益率”(accounting rate of returns),这是Richardson et al.(2006)所定义的净经营资产收益率。表1.B中考虑了“资产毛利率”即收入与销售成本之差所占总资产的比例,这是Novy-Marx(2013)所给出的定义。在表1 中,这些企业基本面都是在ESG指标后12个月进行测量的,并用未来12个月的盈利数据与现有的ESG指标进行统计回归分析。对于上文所定义的4种ESG指标,作者提出了两种计量规范:(1)要基于具有固定月效应的合并样本,且标准误差要聚集在公司层面。(2)基于Fama-MacBeth程序和Newey-West标准方差。本文还控制了公司的贝塔系数、规模和市净率等变量。
表1中的回归1和2使用了本文的E指标变量。作者发现,碳排放指标可以预测表1.A中的会计收益率,但对于表1.B中的毛利率而言是不显著的。因此,作者得出结论,即E指标变量可能与基本面没有显著的关系。对于本文的S指标变量,结果也有所不同。回归3和4的分析得到的负值系数都表明,“罪恶”股票具有相对较强的未来基本面,该发现与Blitz和Fabozzi(2017)的结论一致,但这些统计仅具有边际意义。回归7和8显示,MSCI的总体ESG分数与未来基本面呈正相关,但仅在表1.B中具有统计意义。
在回归5和6中,对于G指标变量的回归结果是显著的。表1.A中的数据表明,应计利润的每一个标准差的增加,会计收益率相应增加0.02,或者在0.1的平均水平上提高20%。
这一发现为本文后面所提到的,应计利润可能包含未来基本面的有关信息提供了相关可能性,且这些基本面可能无法被市场完全定价。表1.B中的对应值也展示了资产毛利率的结果。
同样,更高的G分数预示着未来公司盈利能力的提高,但这个变量的影响相对较小;应计利润每移动一个标准差,毛利润率变化0.006,约为该变量平均水平0.3的2%左右。
结论3.ESG可以预测投资者的需求
表2.A使用了与表1相似的设置,基于三个月前的ESG指标和常规控制来预测机构投资者持股量。机构投资者似乎在构建他们的投资组合时纳入了ESG信息,尤其是本文所选用的4个ESG指标变量与机构持股成正相关,而且这些ESG变量的经济效应是显而易见的。
表2.B和表2.C考虑了交易活动(交易数量的对数)和签署的订单数(买单的总金额占比)的度量。为简洁起见,本文只报告了具有日期固定效应的合并回归分析。对于G变量而言,其统计结果是最直观的,因为数据显示应计利润指标得到改善的时候,交易数量和买单比例均明显增加。但是,对于其他三个指标而言,统计证据并不直接。低碳强度股票和非罪恶股票交易次数似乎有所减少。对于低碳强度的股票,本文还可以看到买单比例的下降。
结论4.ESG可以预测未来收益
到目前为止的实证研究表明,ESG信息与未来的基本面存在密切相关的关系。与此同时,一些证据表明,投资者倾向于将其ESG组合投资于G指标更具有吸引力的股票。如前文所述,两种效应之间的相互作用可能会导致收益溢价或折价,具体取决于哪种效应更强。相对于G指标变量,E、S和整体ESG这三个的指标变量更容易做出收益和需求预测的决策,因为本文发现这三个指标与未来基本面的相关性较小,投资者需求更强。因此,作者认为具有良好E、S和整体ESG分数的股票应该比具有良好G指标的股票更昂贵,且未来收益较低。为评估这些预测,本文在表3和表4中考虑了估值(Tobin’s Q)和风险调整后的收益。
表3显示了ESG指标变量与市净率对数的关联性。表3中的回归1表明,E得分高的股票(即低碳密度的股票、绿色股票)的价格相对高于棕色股票的价格。这与作者之前显示的投资者相对较高的需求是一致的。当在回归4中使用整体ESG度量(来自MSCI)时,也显示了类似的模式。相比之下,当在回归2中使用S指标变量时,作者发现有罪和无罪股票之间的估值没有显著差异。
表4显示了ESG指标对证券收益率的预测能力。基于本文四个ESG指标中的每一个,作者每月将股票分为五个等级(对于有罪指标和无罪指标,分为两个投资组合),然后构建一个投资组合,买入ESG分数较高的股票,卖出ESG分数最差的股票。表4显示了在控制各种资产定价因子的情况下,基于平均权重和市值加权所构建的ESG投资组合的最终表现。
基于G指标变量的投资组合收益非常可观。这种影响的经济规模是巨大的:即使在控制了五个因素(Fama和French,2015)后,等权重投资组合年收益率为7%,市值加权的投资组合年收益率为3%。这一发现强化了本文的结论,即G指标对于那些即使已经在其投资组合决策中使用多个其他投资因子来构建组合的投资者也有较大的意义。
对于E和整体ESG指标变量而言,本文发现几乎没有证据可以说明这两者可以产生超额收益。在本文的样本期内,根据点估计(point estimate),碳排放强度低的公司表现的相对较好,但超额收益也只在10%的水平上显著。本文发现了Hong和Kacperczyk(2009)文献所记录的“有罪溢价”(the sin premium)的一些证据。因为本文考虑的是多头和空头组合,即做多非罪恶股票(ESG较高的股票),同时做空有罪股票(ESG较低的股票)。因此,有罪股票的溢价将被反映为负的超额收益。本文发现对于市值加权组合来说,每年的有罪溢价可达4%,但是对于等权重组合以及五因子或六因子模型来讲,该溢价很小,甚至微不足道。
Abstract
We propose a theory in which each stock’s environmental, social, and governance (ESG) score plays two roles: (1) providing information about firm fundamentals and (2) affecting investor preferences. The solution to the investor’s portfolio problem is characterized by an ESG-efficient frontier, showing the highest attainable Sharpe ratio for each ESG level. The corresponding portfolios satisfy four-fund separation. Equilibrium asset prices are determined by an ESG-adjusted capital asset pricing model, showing when ESG raises or lowers the required return. Combining several large data sets, we compute the empirical ESG-efficient frontier and show the costs and benefits of responsible investing. Finally, we test our theory’s predictions using proxies for E (carbon emissions), S, G, and overall ESG.
本期小编:郭昱江