利用机器学习进行实证资产定价, 金融投资的前沿科学技术!

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

背景知识:1.机器学习之KNN分类算法介绍: Stata和R同步实现(附数据和代码),2.机器学习对经济学研究的影响研究进展综述,3.陈硕: 回顾与展望经济学研究中的机器学习,4.最新: 运用机器学习和合成控制法研究武汉封城对空气污染和健康的影响! 5.Top, 机器学习是一种应用的计量经济学方法, 不懂将来面临淘汰危险!6.Top前沿: 农业和应用经济学中的机器学习, 其与计量经济学的比较, 不读不懂你就out了!7.前沿: 机器学习在金融和能源经济领域的应用分类总结,8.机器学习方法出现在AER, JPE, QJE等顶刊上了!9.机器学习第一书, 数据挖掘, 推理和预测,10.从线性回归到机器学习, 一张图帮你文献综述,11.11种与机器学习相关的多元变量分析方法汇总,12.机器学习和大数据计量经济学, 你必须阅读一下这篇,13.机器学习与Econometrics的书籍推荐, 值得拥有的经典,14.机器学习在微观计量的应用最新趋势: 大数据和因果推断,15.R语言函数最全总结, 机器学习从这里出发,16.机器学习在微观计量的应用最新趋势: 回归模型,17.机器学习对计量经济学的影响, AEA年会独家报道,18.回归、分类与聚类:三大方向剖解机器学习算法的优缺点(附Python和R实现),19.关于机器学习的领悟与反思,20.机器学习,可异于数理统计,21.前沿: 比特币, 多少罪恶假汝之手? 机器学习测算加密货币资助的非法活动金额!

正文

关于下方文字内容,作者袁浩洋,中国人民大学财政金融学院,通信邮箱sfrucyuanhaoyang@163.com

Shihao Gu, Bryan Kelly, Dacheng Xiu, Empirical Asset Pricing via Machine Learning, The Review of Financial Studies, Volume 33, Issue 5, May 2020, Pages 2223–2273, https://doi.org/10.1093/rfs/hhaa009

We perform a comparative analysis of machine learning methods for the canonical problem of empirical asset pricing: measuring asset risk premiums. We demonstrate large economic gains to investors using machine learning forecasts, in some cases doubling the performance of leading regression-based strategies from the literature. We identify the best-performing methods (trees and neural networks) and trace their predictive gains to allowing nonlinear predictor interactions missed by other methods. All methods agree on the same set of dominant predictive signals, a set that includes variations on momentum, liquidity, and volatility.

摘要:这篇文章中,作者对几类机器学习算法在资产风险溢价测度(这一实证资产定价研究中的经典问题)中的表现进行了比较分析。他们证明了当使用机器学习算法进行预测时,投资者能够获得大量的经济收益,在一些情况下,这一收益会两倍于传统文献中以回归为基础的策略所带来的结果。同时,作者也从这些算法中识别出了表现最好的策略(回归树与神经网络),并追踪他们的预测收益,从而允许一些被其他方法所忽略的非线性预测因子交互项在模型中出现。结果上显示,所有的方法都支持同一组主要的预测信号,这组信号包括动量、流动性以及波动性。

Conclusions
本文得到的实证结论如下:
(1)机器学习有潜力提高我们对于资产收益的实证理解。对于本文所使用的庞大预测因子集,传统的实证方法表现较为糟糕,尽管加入惩罚项或是引入PCR、PLS等降维方法后,线性回归模型的样本外有所提高,但机器学习方法仍很轻松地取得了更好的表现;
(2)在考虑非线性预测因子的情况下,回归树以及神经网络比广义线性模型的表现更好;
(3)相对浅层的学习比深度的学习表现更好。在利用神经网络进行预测时发现,当中间的隐藏层从一层增加到五层时,表现最好的是三层时,超过三层之后,预测表现开始下滑。同样地,增强树以及随机森林也倾向于选择更少的“树叶”(平均下来少于6片叶子);
(4)当预测组合收益率时,非线性方法与OLS方法之间的距离会被拉大。作者以机器学习模型所预测的个股收益率数据为基础,建立起自下而上的股票组合,并计算各个组合的收益率,发现机器学习方法表现得仍然更好;
(5)利用机器学习进行预测的经济收益是巨大的,这里的经济收益主要以股票组合的夏普比率的变化来衡量;
(6)本文依据因子的信息含量,对于每个股票因子在每种方法中的重要程度进行了排序,最终发现最有价值的预测因子分别来自于价格趋势、流动性和波动性。
关于一些计量方法的合辑,各位学者可以参看如下文章:实证研究中用到的200篇文章, 社科学者常备toolkit”、实证文章写作常用到的50篇名家经验帖, 学者必读系列过去10年AER上关于中国主题的Articles专辑AEA公布2017-19年度最受关注的十大研究话题, 给你的选题方向2020年中文Top期刊重点选题方向, 写论文就写这些。后面,咱们又引荐了使用CFPS, CHFS, CHNS数据实证研究的精选文章专辑!这40个微观数据库够你博士毕业了, 反正凭着这些库成了教授Python, Stata, R软件史上最全快捷键合辑!关于(模糊)断点回归设计的100篇精选Articles专辑!关于双重差分法DID的32篇精选Articles专辑!关于合成控制法SCM的33篇精选Articles专辑!最近80篇关于中国国际贸易领域papers合辑!最近70篇关于中国环境生态的经济学papers合辑!⑨使用CEPS, CHARLS, CGSS, CLHLS数据库实证研究的精选文章专辑!最近50篇使用系统GMM开展实证研究的papers合辑!

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 官员方言  | 微观数据 | 内部数据
计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID
数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验
(0)

相关推荐