温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
证券
_20180606_
金工
专题报告
海外
文献
推荐
金融工程金融工程|金工专题报告金工专题报告 请务必阅读正文之后的信息披露和免责申明 1 金融工程金融工程 证券证券研究报告研究报告 2018 年年 06 月月 06 日日 作者作者 吴先兴吴先兴 分析师 SAC 执业证书编号:S1110516120001 18616029821 相关报告相关报告 1 金融工程:金融工程-海外文献推荐 第 42 期 2018-05-30 2 金融工程:金融工程-海外文献推荐 第 41 期 2018-05-23 3 金融工程:金融工程-海外文献推荐 第 40 期 2018-05-16 海外文献推荐海外文献推荐 第第 43 期期 价值投资的事实和流言价值投资的事实和流言 价值投资在至少一个世纪之前就是投资领域的一部分。特别是从 20 世纪80 年代开始,多元化的“价值因子”或“价值效应”得到了广泛的研究,但价值投资仍存在许多疑问,我们目的就是搞清楚这些问题。本文专注于多元化的系统价值策略,探讨了这一策略如何更集中的实施。我们强调了许多价值投资的观点,并尝试去证明或反驳它们。在这个过程中我们参考了大量的学术文献,并基于易访问、且符合行业标准的数据进行了简单有力的实证。机器学习与资产定价机器学习与资产定价 本篇文章探讨了将机器学习体系融入实证资产定价的可行性。该报告尝试了数个机器学习算法来在横向和纵向上分别对股票收益进行预测,所采用的算法包括广义线性模型,降维法,改进回归树,随机森林和神经网络。相对于传统方法而言,机器学习对资产收益的预测表现明显提升,我们在样本外表现检验中得到了非常高的拟合优度2;其中,表现最好的算法(回归树和神经网络)能够预测出被其他方法忽略的非线性相互作用。此外,我们发现动量、流动性和波动性因子在所有算法下都有很好的表现。风险风险提示提示:本报告内容基于相关文献,不构成投资建议。金融工程金融工程|金工专题报告金工专题报告 请务必阅读正文之后的信息披露和免责申明 2 内容目录内容目录 价值投资的事实和流言价值投资的事实和流言.4 1.引言.4 2.事实和流言.5 流言 1:价值投资是一种只有通过集中投资组合才能实现的特异性投资技巧.5 流言 2:价值基于规则,周转率低,所以属于被动策略.5 事实 1:“基本面指数化”是且仅是系统性价值投资.6 事实 2:盈利或者质量因子可以用来提高价值投资收益,是符合基于风险溢价的有效市场假说.6 流言 3:价值是“多余”的.7 事实 3:价值投资不仅仅适用于股票.8 事实 4:价值可以多种方式衡量,以多个变量综合衡量最佳.8 事实 5:单一价值本身在大盘股中出人意料地表现疲软.9 流言 4:价值的有效性是风险溢价而非行为异常的结果,因此不存在回撤的风险.10 3总结.11 机器学习与资产定价机器学习与资产定价.12 1.引言.12 1.1.主要贡献.12 1.2.什么是机器学习?.12 1.3.为什么用机器学习方法进行资产定价?.12 1.4.机器学习的缺点.13 1.5.哪些机器学习模型可以投入实用?.13 2.方法论.13 2.1.样本集划分和超参数.13 2.2.线性回归.13 2.3.广义线性模型.14 2.4.增益回归树和随机森林.14 3.关于美股市场的实证研究.15 3.1.不同模型对个股截面差异的预测表现.15 3.2.哪些风险因子更加重要?.16 图表目录图表目录 图 1:结合动量和盈利因子的价值因子夏普比率.7 图 2:Fama and French 五因子模型的复现.8 图 3:价值因子的单一和多样化方案.9 图 4:不同价值方案的十年期夏普比率.9 图 5:小/大盘股的价值收益率.10 图 6:小/大盘股下的价值动量组合夏普比率.10 图 7:回归树案例.14 金融工程金融工程|金工专题报告金工专题报告 请务必阅读正文之后的信息披露和免责申明 3 图 8:样本外表现结果展示.15 图 9:每个模型在不同时段的模型复杂度.16 图 10:影响个股的因子重要性排序.17 图 11:不同因子在所有模型中重要性的综合排序.18 图 12:宏观因子在每个模型中的相对重要性.19 金融工程金融工程|金工专题报告金工专题报告 请务必阅读正文之后的信息披露和免责申明 4 价值投资价值投资的事实和流言的事实和流言 文献来源:Asness,C.S.,Frazzini,A.,Israel,R.,&Moskowitz,T.J.(2015).Fact,fiction,and value investing.Final version published in Journal of Portfolio Management,Vol.42,No.1 推荐原因:价值投资在至少一个世纪之前就是投资领域的一部分。特别是从 20 世纪80 年代开始,多元化的“价值因子”或“价值效应”得到了广泛的研究,但价值投资仍存在许多疑问,我们目的就是搞清楚这些问题。本文专注于多元化的系统价值策略,探讨了这一策略如何更集中的实施。我们强调了许多价值投资的观点,并尝试去证明或反驳它们。在这个过程中我们参考了大量的学术文献,并基于易访问、且符合行业标准的数据进行了简单有力的实证。1.引言引言 最近面对围绕着动量投资的流言,我们发现了两件事:1)价值投资存在很多疑问,2)如果戳穿围绕着动量投资的流言,有些人会得到错误的印象:即坚守动量意味着贬低价值。即使经验丰富的投资者也常常错误地认为不能同时相信价值和动量投资。价值是“廉价”的证券平均表现优于“昂贵”的证券的现象。价值溢价是通过购买(绝对的做多或相对基准的超配)廉价资产和卖出(卖空或低配)昂贵资产而获得的收益。价值溢价在以下样本中被证明是一个行之有效的经验事实:87 年的美国股票数据,30 多年样本外研究结果,以及其他四十多个国家,十几个资产类别,甚至可以追溯到维多利亚时代的英国。重要的是,我们对“价值投资”的定义是高度多样化的“学术”版本(尽管许多从业者也遵循它),而不是集中于价值选股(我们将在下文进一步讨论)。我们的出发点是“纯”价值,即仅根据可量化方法计算出的,价格相对于某些基准如账面价值的比值。它没有基于成长(有些人称之为“合理的价格下的成长”显然则不仅限于成长)或者盈利溢价进一步来调整。以后我们将讨论“纯”价值,以及考虑了其他因素后的价值,它们之间的相互作用。价值策略在金融市场上有着悠久而传奇的历史。它们通常被归功于 Benjamin Graham和 David Dodd。20 世纪 20 年代末,他们主张通过购买有利可图但被低估的资产来进行价值投资(与我们提到的“纯价值”相比这是一个双重条件,也是一个重要的区别)。价值投资在上个世纪的大部分时间里被认为是股票投资领域的重要组成部分,加上没有被记录的情况还会更久(套用一句罗马谚语:“我来了,我看到了,我用低价购买了。”原文是凯撒大帝说的:“我来了,我看见了,我征服了。”)尽管如此,价值投资仍然存在许多疑问。有些疑问来自于价值策略反对者的贬低,有些疑问是被那些明里暗里鼓吹价值投资的人有意或无意地所造成。本文的主要内容是验证一些价值投资方面需要澄清的事实和流言。我们证明的事实包括:价值因子和其他因子搭配使用效果最好,这和基于风险的价值观一致;价值最好是由多个相关的变量(而不仅仅是单一变量,如账面价值比市值)来衡量;价值策略正是最近流行的“基本面指数化”投资方法;价值在大盘股的弱效应(尤其是相对于大市值和小市值的其他因子)。我们试图澄清的流言包括:价值投资只在集中投资组合中有效的错误观念;价值投资是一种“被动”的策略;在新出现的学术因子面前,价值是多余的;价值策略只适用于挑选股票。最后,我们采取了一种普遍持有的观点:价值仅仅是对风险的补偿,而不是让人提心吊胆的策略,未来持续的价值溢价只能与基于风险的有效市场观相一致。我们当然不会拒绝有效市场,但要注意,价值的成功可能发生在一个有效市场,无效市场,或介于两者之间。在每一个情境中,价值都受时间变化的影响且很难消失。正如我们之前关于动量的论文,我们参考了出版的和同行评审的学术论文,并使用美 金融工程金融工程|金工专题报告金工专题报告 请务必阅读正文之后的信息披露和免责申明 5 国股市最知名和直接的公开数据对价值投资的事实和流言进行验证。最后,我们研究的内容包括价值投资的优势和缺陷。我们认为自己是价值投资的强有力支持者,尤其是在价值与一些其他因子(如动量和盈利能力)一起使用时。我们的讨论不代表否认价值策略是良好投资的基石之一。相反,讨论让我们更清楚地看到价值投资的利弊。2.事实和流言事实和流言 流言流言 1:价值投资是一种只有通过集中投资组合才能实现的特异性投资技巧:价值投资是一种只有通过集中投资组合才能实现的特异性投资技巧 正如引言中所讨论的,我们关注的是高度多样化、系统化的“价值投资”,而不是基于集中价值的特质股票选择。然而有些人认为,一个成功的价值投资者必须在一个集中的投资组合中应用价值策略,深刻理解每一个股票,以便找出“廉价”股票。Warren Buffett,通常被认为是一个价值投资者,自然声称如此。如 Warren Buffett 本人所说,他投资主题的共同点是寻找“企业价值与企业在市场中价格之间的差异”。他将这一理念应用在了深入调查和了解少数股票,并长期集中投资它们。显然他做得很好。但是 Benjamin GrahamWarren Buffett 的导师,认为有长期证据支持多样化的投资组合,而不是基于少数股票的集中投资组合。在智慧的投资者(1973 修订版)中,他写道:“在投资者的普通股列表中,肯定会有一些会令人失望但基于上述选择的原则,加上投资者希望应用的其他明智标准,在过去的几年里,多样化的组合应该表现得不错。至少长期经验告诉我们是如此。从各种资产类别中可以看出强有力的长期证据支持系统的价值策略能带来良好的长期收益。Warren Buffett 能够成功地挑选出个别“廉价”的股票,不应破坏这种观点.当然,系统性和特异性价值投资概念并不是互斥的。一个非常善于识别廉价股票的投资专业人士应该得到很多信任。但能够系统地投资一组廉价股票的经理人也可以获得一个积极的长期收益来源。投资于这两种方法中其中之一的投资者应该把这两种方法都看作是产生价值的过程多样化的方法,只要投资者确信有收益。在这篇文章中,我们提倡(但也批判性地)多元化价值投资过程,指出它很大程度上缺乏建立高度集中投资组合的能力,但不必否认后者的可能性。至少我们希望让读者相信,这两种投资方法不是相互排斥的。流言流言 2:价值基于规则,周转率低,所以属于被动策略价值基于规则,周转率低,所以属于被动策略 虽然我们将系统价值投资与 Warren Buffett 的集中选择股票区分开来,但我们经常听闻人们把它带到另一个极端断言我们所说的系统价值策略是被动策略,就像简单地买入和持有股票市场指数一样。其含义是,一个价值策略不做“主动”的选择,因此不是“主动的管理”,它在投资领域中被描绘成贬义词。我们的观点是:任何偏离市场组合,市值加权资产的资产组合,其定义都是“主动的”。这是因为市场组合是每个人可以同时持有的唯一投资组合。另一方面,一个偏离市场权重的投资组合必须由愿意采取另一方赌注的其他投资者来平衡。例如,对于每一个倾向或选择廉价股票的价值投资者来说,另一方必须有投资者看重成长型的昂贵股票。因此,存在市值加权时,每个人都不能同时持有或倾向价值策略组合,这不是一个人人都能做到的买入和持有策略。在我们看来,这使得价值策略成为一种“主动”的选择。有人可能会说,我们对被动的定义太狭隘了(我们对主动性的定义过于宽泛),他们觉得被动策略是遵循简单规则和低周转率的策略。然而,简单的反例表明,这不是被动的适当定义。以一个单一的股票组合为例,买入并持有股票。想象一个员工把她所有的财富都投入到她工作的公司。根据以上定义,这将被认为是一个被动的投资组合,但这明显是一个主动将赌注押在一个公司的集中投资组合。Warren Buffett 的投资组合在这个定义下也会被认为是被动的,因为他的周转率甚至低于典型的系统价值策略。至于基于规则,按照定义进行微秒交易的高频交易者是基于规则的,但我们很难称之为被动投资者。金融工程金融工程|金工专题报告金工专题报告 请务必阅读正文之后的信息披露和免责申明 6 坦白地说,我们发现主动与被动管理之间的争论只是语义上的争论。投资者面临的主要问题是,他们正在以什么价格/成本获得什么,无论是来自主动产品还是被动产品,都是无关紧要的,只要它为投资组合增加价值(无论定义如何,主动和被动都有好的和坏的产品)。我们坚信,一个价格合理、具有系统性、纪律性、规则性、低收益率的投资组合是一项卓越的投资无论你称之为什么,我们都称之为主动投资。事实事实 1:“基本面指数化”是且仅是系统性价值投资“基本面指数化”是且仅是系统性价值投资“基本面指数化”(FI)是根据股票价格、股利、现金流、销售、收益等各种基本因素对股票进行加权,而不是用传统指数基金的市值加权。支持者指出,如果价格包含误差,那么从定义上看,一个基于市值加权的指数里,昂贵股票的权重会更大,而廉价股票的权重会更小(它听起来像我们正在讨论价值投资)。当然,价格也会因理性风险的原因而变化,但我们稍后会回到这个问题上来。在任何情况下,基本面的加权都会产生一个投资组合,不太可能出现这种潜在的偏差。但是当它的支持者过分强调这不仅仅是价值投资时,会增加混乱,掩盖真相。一个方程很好地说明了这一点。如果基于一个度量(例如,账面价值)创建基本面指数,则其中持有的股票权重是根据它在传统市场资本加权指数中的函数生成(假设是在同一个股票池里完成的):=()是基本指数中股票的权重,是其在传统市值加权指数中的权重,是市值加权指数的账面市值比,是公司 I 的账面市值比。为了看看数据是怎么说的,接下来我们使用Ken French网站的月度数据对1962到2014年初的彭博数据中的美国市场大盘股进行 FI 的回归测试。左边衡量的是在这个时期,通过从 FI 的月度回测中减去市值加权市场组合的收益,观察基本面指数能超过市值加权市场组合的多少。右边是简单的 HML 因子,即高账面市值比和低账面市值比股票之间多样化投资组合的差额收益率。以下是 t 统计量的结果:每年截距为 4 个基点(-0.10),HML 因子的权重为正的 0.37,且有 66%的 R 方。结果表明,基本面指数的平均收益没有超过 Fama and French 的 HML 因子,增加其他因子或改变以上因子(例如添加动量和市值因子,更广泛地定义 HML 值),可以在任一方向上改变其截距,但仍然与价值的关系非常紧密。具体的结果当然会根据具体的回归变量而变化。但是,FI 载荷的结果是非常稳健的。很明显,FI 只是一个系统的价值策略和简单的策略。事实事实 2:盈利或者质量因子可以用来提高盈利或者质量因子可以用来提高价值投资价值投资收益收益,是符合基于风险溢价的是符合基于风险溢价的有效市场有效市场假说假说 有些人认为,利用盈利能力来提高价值策略与基于风险的世界有效市场观不一致,但我们不认为这是必须的。有效市场假说(EMH)指出,所有的信息都应该纳入价格,这样任何收益的可预测性都必须是关于风险溢价。EMH 没有规定所有的公司都应该有相同的价格或相同的价格倍数,比如 B/P。事实上,利用盈利能力来提升价值策略与有效或低效的市场观相一致。通过确定哪些公司具有低(高)B/P,因为它们的利润更多(更少)而不是更少(更多)风险,盈利能力有助于从有效市场的角度来识别风险最高(最高预期收益)的资产。从低效的市场情况来看,盈利能力有助于找到最低价的资产,考虑到价格应该随质量而变化。简单地说,在任何一种假设下,并非所有的公司都应该拥有相同的 B/P,而诸如盈利能力等措施有助于消除 B/P 的变化,这种变化伴随着质量的变化而不是预期的收益。Graham and Dodd 实际上提倡使用盈利能力和其他质量措施来“清理”价值。也就是 金融工程金融工程|金工专题报告金工专题报告 请务必阅读正文之后的信息披露和免责申明 7 说,他们比 Buffett 更有系统性(至少 Graham 是),他们不是“纯粹”的价值投资者。来自智慧的投资者中安全选择的主要标准(1973 修订):(1)足够的规模;(2)足够强的财务状况;(3)至少在过去的 20 年中持续分红;(4)在过去的 10 年中没有盈余赤字;(5)至少持续 10 年实现每股收益的三分之一增长;(6)股票价格不超过净资产的 1.5 倍价值;(7)价格不超过过去三年平均收益的 15 倍。只有最后两个将被认为是大多数的估值度量。在我们看来,其余的属于识别成长、高质量公司的范畴。事实上,上面列出的安全选择标准与 Peter Lynch 的“合理价格增长”(或“GARP”)概念非常一致。这一想法再次表明,所有股票不一定以相同的估值比率出售,这是一种纯粹的价值投资策略。纯粹价值投资忽略了这一真理,事实上,尽管不合逻辑的隐含观点认为,所有估值都应该以同样的价格出售,但事实证明,它是一种投资工具。一个非常好的策略可以在一点噪音中幸存下来。然而,人们可以通过认识到估值比率不需要完全相同的处理来做得更好。使用盈利质量或盈利能力的衡量标准,可以识别出能对投资组合产生更大作用的廉价且盈利的公司。因此,价值和成长策略理论上不是不相容的,但是数据是怎么说的呢?图 1 展示了价值(HML),动量(UMD),盈利能力(Fama and French 的 RMW)以及它们的各种组合的年度夏普比。由于盈利措施在 1963 年 7 月开始,结果覆盖 1963 至 2014 年,并且在每种情况下都有对因子的多空操作:图图 1:结合动量和盈利因子的价值因子夏普比率结合动量和盈利因子的价值因子夏普比率 资料来源:Journal of Portfolio Management,天风证券研究所 如图所示,价值与盈利能力的简单 60/40 组合将夏普比率从 0.46 提高到 0.58。此外,价值与动量的 60/40 组合使夏普比率升至 0.79。重要的是,图 1 最后一列所示,在价值、动量和盈利能力因子 1/3 等权的情况下,夏普比率升至 0.84 甚至更高。因此使用一个简单的优化器来选择每一个因子的权重,可以使组合的夏普比率最大化。无论你是一个系统的、多元化的价值管理者还是一个集中的价值管理者,增加盈利能力作为另一个因子可以极大地提高投资组合收益率。显然,价值并不单单发挥作用。而且,将其与其他因子,如盈利能力和动量相结合,可以形成更好的投资组合。流言流言 3:价值:价值是“多余”的是“多余”的 Fama and French(2014)提出了一种新的五因子模型(FFM):在之前的三因子模型上增加了“利润率”因子(RMW)和“投资”因子(CMA)。类似地,Asess、Frazzini 和Pedersen(2014)提出了一个模型,该模型增加了一个复合的“质量”因子,其中包括盈利能力和投资相关因素,这些因素通常被认为是企业质量的一部分。关于 FFM 的一些争议是,价值因子 HML 被认为是“多余的”。即它的收益可以完全被其他四个因子所解释。那我们是否应该停止建立以价值投资为核心特征的投资产品,而转向其他产品呢?我们认为不。原则上,价值是没有错的,如 HML 所带来的收益,被其他因子例如盈利能力所解释,这意味着有更好的方法来测量和捕获价值效应,并不意味着价值是多余的:1)Fama and French 的 HML 因子使用了一个高度滞后的价格,2)Fama and French 从未考虑过动量因子。确切地说,有两件事在新的 Fama and French 五因子模型中复活 HML,这两个模型都与观察值和动量相关。第一个是在模型中明确地包含动量因子。第二个是通过使用最新的、金融工程金融工程|金工专题报告金工专题报告 请务必阅读正文之后的信息披露和免责申明 8 不滞后的价格措施来构建价值因子,这个看似微小的变化,结果会产生相当大的影响。图 2 展示了上述的两种改变。每行展示了回归系数,括号内为 t 统计量。第一列是回归后的截距或 alpha,最后列为 R 方。如果截距与 0 显著不同,例如,在一个合理的置信水平上通常具有统计学意义,通常意味着它的 t-统计量2 的绝对值,那么这个因子不是多余的。如果截距与 0 不是显著不同,那么这个因子是多余的。图图 2:Fama and French 五因子模型的复现五因子模型的复现 资料来源:Journal of Portfolio Management,天风证券研究所 图 2 的第一行复制原始版本,正如第一行所示,HML 在这个特定的模型中确实是多余的。现在,让我们在图 2 第四行加回动量因子。我们发现 HML-DEV 的截距项显著异于 0,证明价值因子不是多余的。事实事实 3:价值投资:价值投资不仅仅适用于股票不仅仅适用于股票 价值策略真的可以应用在股票之外吗?对许多人来说,价值是一个只适用于股票的概念,部分是因为大多数学术文献和证据都集中在股票上,而且,因为人们最常用的衡量价值的方式是按一定比例的会计价值与市场价值进行比较。由于在其他资产类别中不存在会计价值,如债券、商品、货币等。通常认为价值策略不适用于这些资产。但是,我们可以更广泛地思考什么是价值投资试图实现的:识别廉价和昂贵的资产。如果我们能测量其他资产类别中的廉价性和昂贵性,那么我们就可以在其他资产类别中形成价值组合。在其他资产类别中,我们也可以形成直接的基本价值度量。例如,在债券中,价值的度量是债券的实际债券收益率或收益率减去预期通胀。对于货币而言,购买力平价(PPP)偏离了两个国家的一篮子商品相对于其汇率的价格,也可能意味着廉价和昂贵,因为长期汇率应该收敛到各国的购买力平价。Asess 等人发现,不仅在每个资产类别中有可靠的价值溢价,而且资产类别之间的价值策略的相关性是正的。并且一个资产类别中的廉价资产会与其他资产类别中的廉价资产一起变动,这是一个贯穿所有市场的整体价值效应。因此,价值不仅仅是一个狭义的概念,还可以更广泛地应用于任何资产类别。这意味着可以创建更稳健和多样化的价值策略,以提供更好和更稳定的性能。事实事实 4:价值可以多种方式衡量,以多个变量综合衡量最佳价值可以多种方式衡量,以多个变量综合衡量最佳 简单的直觉告诉你这是真的。尽管如此,我们还是把这句话放在数据中进行测试。在学术界,衡量价值的主要方法是利用账面市值比,或每股账面价值。这一特定的价值衡量方法已经在一系列论文中被 Fama and French 所推广。事实上,Fama and French 使用了 金融工程金融工程|金工专题报告金工专题报告 请务必阅读正文之后的信息披露和免责申明 9 各种基本的价格比率,如对价格的收益闭上现金流量,以及其他价值衡量方法,如股息收益率、销售增长率。图 3 汇总统计了使用不同的价值方案对股票排名的 HML 风格投资组合。这些投资组合来自于 Kenneth French 的网站,涉及到前 30%的股票(价值股)减去后 30%的股票(成长股),基于账面市值比(BE/ME)、每股收益(E/P)、每股现金流(CF/P)、股息收益率(D/P)和过去 5 年的负增长收益率。虽然不同的方案收益有一定的变化,但所有 HML 风格的投资组合都有正收益,并高度相关。图图 3:价值因子的单一和多样化方案价值因子的单一和多样化方案 资料来源:Journal of Portfolio Management,天风证券研究所 图 3 表明,多个价值度量产生更稳定的价值组合,提供更高的夏普比率、更高的信息比率和更稳健的收益。除非理论决定将一个度量优先于所有其他度量,平均的方案通常是最好的和最稳健的方法。图图 4:不同价值方案的十年期夏普比率不同价值方案的十年期夏普比率 资料来源:Journal of Portfolio Management,天风证券研究所 图 4 中,我们将 1951 到 2014 年每个值测量的每十年中最高的夏普比率以灰色突出,而最低的则以黑色突出。可以看到在整个周期内,多个措施的平均值通常是最好的。事实事实 5:单一价值单一价值本身本身在大盘股中出人意料地在大盘股中出人意料地表现表现疲软疲软 许多学术研究表明,回归预测性在小盘股中更为强劲,这也同样适用于价值。然而,仅有价值这个因子时,它的收益可预测性对大盘股而言是相当无效的。图 5 的“小 HML”,这是对小盘股进行买多廉价和卖空昂贵股票的操作,“大 HML”是对大盘股进行同样的操作。“常规 HML”,是小 HML 和大 HML 投资组合收益的均值。这些投资组合的平均市场调整收益率报告包括四个样本周期。金融工程金融工程|金工专题报告金工专题报告 请务必阅读正文之后的信息披露和免责申明 10 图图 5:小小/大盘股的价值收益率大盘股的价值收益率 资料来源:Journal of Portfolio Management,天风证券研究所 在整个样本期间,小盘股市值调整后的收益率为每年 5.5%,但在大市值中,年均收益率不到 1.7%。从子样本结果来看,大盘股似乎只有两个样本有显著的正 HML 溢价。在这两个样本之外的时期没有证据表明大盘股中存在价值溢价。尽管如此,但即便是在大盘股中,我们仍然是价值投资的大力支持者。为什么?因为价值在大盘股内的疲弱不应该和价值对投资组合的贡献混淆,特别是如我们先前所展示的那样,它具有动量或盈利能力。图6着眼于结合动量后的小市值和大市值策略。小市值策略原本具有较高的夏普比率,通过将其与动量相结合,仍然大大提高了夏普比率。对于大盘股,其本身仅产生 0.25 夏普比,将其与动量相结合后产生了稳健的 0.65 夏普比。换言之,将价值与动量结合起来看作是一个系统,小盘股和大盘股的结果是相似的,更重要的是对于大盘股来说是效果更明显。动量再次拯救了价值。图图 6:小小/大盘股下的价值动量组合夏普比率大盘股下的价值动量组合夏普比率 资料来源:Journal of Portfolio Management,天风证券研究所 流言流言 4:价值的有效性是风险溢价而非行为异常的结果,因此不存在回撤的价值的有效性是风险溢价而非行为异常的结果,因此不存在回撤的风险风险 这里有两个部分。其一,价值是风险溢价,意味着价值策略通过在市场中获得风险补偿来提供有吸引力的长期收益。学术界继续争论这个概念,我们最好的猜测是,风险和行为的原因都在起作用。其次,即使价值是一种风险溢价,并不意味着它在未来不会消失。因此,无论价值是风险溢价还是行为异常,回撤的危险都存在。首先要承认,关于价值背后的经济解释存在一场生动而健康的辩论。没有一个价值模型是如此令人信服的。在大萧条和全球金融危机期间,人们支持风险为价值的基础。行为 金融工程金融工程|金工专题报告金工专题报告 请务必阅读正文之后的信息披露和免责申明 11 理论侧重于投资者对信息的误反应,导致暂时的误定价。如果价值是一种风险溢价,那么,这是否意味着我们不期望它消失(它的潜台词:如果不是风险,那么它会消失)?如果风险改变或风险补偿发生变化,那么预期收益也会随之改变。相反,如果价值不是风险,而是由于错误定价,它是否遵循价值回归必然和最终消失?不,如果错误定价消失,投资者的偏见将不得不消失,或者有足够的资本愿意控制交易。显然,我们的观点是,基于风险和行为的理论都提供了合理的依据来期待未来的持续价值溢价。来自大几十个金融市场和不同资产类别的大量样本外数据证实,投资者对价值投资的认识至少在三年后还不会没有减弱的迹象,价值溢价不可能很快消失。最后,如果价值消失了呢?假设,价值向一个零预期收益前进,它仍然是一个有价值的投资工具吗?答案是肯定的,原因是价值与其他因子,如动量或盈利能力相结合,会带来巨大的多元化效益。另一个经常被忽略的观点是,并非每个投资者都可以持有价值(或倾向于价值)。记住,所有的投资都必须按照市场的总和来确定。因此,对于每一个价值投资者来说,都必须有一个愿意投资另一方的成长型投资者。如果不是,每个人都倾向于价值型股票,那么价值溢价将不再存在。因此,对于价值溢价的两种解释,一个关键是“谁在另一边?”。在行为理论的情况下,那些具有行为偏差的人喜欢追逐富有魅力的成长股,而忽视下跌的价值股。只要它们继续生存下去,价值溢价就完好无损。而基于风险的解释,答案是那些不愿承担风险的投资者。综上所述,关于价值溢价是否存在是因为风险还是基于行为的解释仍然存在,我们相信真相可能是两者的结合。3总结总结 尽管至少持续了三十年的实证研究,但围绕价值投资仍然存在很多混乱点。正如我们之前所说的,如果一个人想挑战现有的理论,那也很好。在我们之前的论文中讲解了关于动量的神话,并详述这一事实中的事实和流言,我们最终在动量和价值这两个因子上都持很强的信念,特别是当它们结合使用时。金融工程金融工程|金工专题报告金工专题报告 请务必阅读正文之后的信息披露和免责申明 12 机器学习与资产定价机器学习与资产定价 文献来源:Gu,S.,Kelly,B.T.,&Xiu,D.(2018).Empirical asset pricing via machine learning.Social Science Electronic Publishing.推荐原因:本篇文章探讨了将机器学习体系融入实证资产定价的可行性。该报告尝试了数个机器学习算法来在横向和纵向上分别对股票收益进行预测,所采用的算法包括广义线性模型,降维法,改进回归树,随机森林和神经网络。相对于传统方法而言,机器学习对资产收益的预测表现明显提升,我们在样本外表现检验中得到了非常高的拟合优度2;其中,表现最好的算法(回归树和神经网络)能够预测出被其他方法忽略的非线性相互作用。此外,我们发现动量、流动性和波动性因子在所有算法下都有很好的表现。1.引言引言 1.1.主要贡献主要贡献 本文主要贡献有两点:一、给出了评价预测风险溢价的一个新标准高样本外拟合优度指标,这个标准可以用于评价各类机器学习方法;二、我们将机器学习和实证资产定价领域结合,和传统实证方法相比,机器学习可以对更多因子进行分析,也可以提供更多的因子函数形式,这将推动实证资产定价领域向前迈进一大步。1.2.什么是机器学习?什么是机器学习?目前对机器学习的定义并不是特别完善,在不同的情景下对它往往有不同的解释。我们用机器学习这个术语来描述:1)一系列用来统计预测的高维模型;2)与“规则化”的方法相结合来进行模型选择和减少过拟合的现象;3)同时利用有效的算法在大量潜在模型因子中挑选出合适的因子。其中,高维模型的定义决定了机器学习作为一种预测方法是比传统计量方法更为灵活的。这种灵活性使得我们更有可能较好地处理股票市场中复杂的信息,但是同时这也增加了过度拟合的风险。机器学习在模型建立过程中的改良措辞能够其在样本外预测时也能有较好表现。最后,由于潜在因子过多,比较因子的所有组合是不可行的,机器学习对因子的挑选保证了我们可以用一个较低的计算成本得到一个优化结果。1.3.为为什么用机器学习什么用机器学习方法进行资产定价?方法进行资产定价?实证资产定价的如下几个特点使得机器学习成为一个很合适的方法。1)实证资产定价的主要研究方向有二。其一是研究不同资产预期收益的截面差异;其二是对股票市场的因子风险溢价进行预测;机器学习方法正是为了预测才产生的,因此非常适合用来测量资产风险溢价这一类预测问题。2)能够用来建模预测股票收益的潜在因子数量非常大。和个股价格相关的因子已经很多,和市场总体走势相关的宏观因子数量同样数不胜数。此外,这些因子普遍有自相关性。传统的预测方法很难在这种情况下进行准确的预测,而机器学习算法凭借在因子选择和降维技术上的优势,成为解决这类棘手问题的更好选择。3)因子函数形式的不确定性使得资产定价问题变得更为复杂。因子与风险溢价的关系可能是线性的,也有可能是非线性的,而非线性关系的具体形式更是难以确定。机器学习的三个特征能够很好的处理这个问题。第一,机器学习囊括了很多差别很大的方法,提供了更多具体分析的方式。第二,机器学习中的一些算法如广义线性模型,回归树和神经网络本身就是为了处理复杂的非线性问题而产生的。第三,为了避免过拟合现象,因子的函数形式很有可能被限制,但参数惩罚和保守的模型选择准则的存在补足了这一短板,提供了更多可能的函数形式。金融工程金融工程|金工专题报告金工专题报告 请务必阅读正文之后的信息披露和免责申明 13 1.4.机器学习的缺点机器学习的缺点 测度风险溢价从根本上说是有关预测的问题,因此机器学习有很大的潜力能更准确地预测出收益。但即便准确性提升,预测还是无法体现因子和收益背后的经济关系和相关机制,机器学习本身更是无法判断资产价格和变量内在的联系。如果目标是探究经济机制,那机器学习仍旧是有帮助的,不过还需要经济学家自己主观地建立一个假设来解释机器学习算法的效果。已有学者在研究如何把机器学习和均衡资产定价相结合,这是一个有未来研究空间的方向。1.5.哪些机器学习模型可以投入实用?哪些机器学习模型可以投入实用?我们根据资本市场的特征选择了一系列合适的机器学习算法,包括线性回归,有惩罚的广义线性模型,基于主成分回归(PCR)和偏最小二乘法(PLS)的降维法,回归树(包括增益回归树和随机森林)以及神经网络。我们并没有尝试所有的机器学习算法,而是排除了其中几个如支持向量机这类主要用于分类问题而非连续变量预测的算法。2.方法论方法论 这一部分主要介绍了所有我们使用到的机器学习算法。对每一个算法我们都将介绍三个基本构成元素。第一,用来测量风险溢价的统计模型。第二,目标函数。所有算法的基本目标函数都是均方误差(MSE)。规则化体现在不同的均方误差目标,例如增加惩罚参数和排除极端值,其目的在于避免过拟合以及提升模型在样本外的表现。第三个元素是该算法如何有效地计算并且找到最佳因子组合及函数形式。2.1.样本集划分样本集划分和超参数和超参数 机器学习领域中存在一个很重要的概念:超参数。它决定了每个模型的复杂性,并且是模型建造者防止过度拟合、提升模型样本外表现的首要手段。常见的超参数有随机森林中树的个数、深度,惩罚参数等。在进行研究的过程中,我们首先将样本集划分为三个部分。然后在一组主观选择的超参数下用第一部分样本估计模型,再用第二部分样本对模型进行验证,并且计算目标函数判断误差。重复这一过程来找到最优化的超参数组合。第三部分样本将作为测试集来评估所得模型的预测准确性。2.2.线性回归线性回归 线性回归是机器学习中最为简单的模型之一。我们选择最小二乘法来进行估计。该模型认为可以用因子z和参数 的线性组合来预测条件收益g。模型不考虑非线性关系以及因子间的相关关系:目标函数和计算方法普通最小二乘法(OLS):其中股票的索引为 1,N,月份的索引为 1,T。最小化L()可得到最小二乘估计量。采用最小二乘法估计得优势在于避免了复杂的优化和计算。金融工程金融工程|金工专题报告金工专题报告 请务必阅读正文之后的信息披露和免责申明 14 2.3.广义线性模型广义线性模型 广义线性模型在线性回归的基础上增加了因子非线性转化,因此提供了更广的因子选择空间。其模型类似于线性模型,但增加了 K 节点的样条函数:其中(.)=(1(.),2(.),(.)本函数组成的向量,其参数是一个 K N 矩阵=(1,2,)。目标函数和计算方法:因为该模型是在简单线性模型的基础上增加高阶项,我们可以选用相同的估计量。另外,由于在此模型中因子数量增加,我们用惩罚因子 来控制自由度并且提升模型在样本外的预测表现。最终使用的函数是 Group LASSO,一个特别为此类情形设定的惩罚函数,它所含的超参数有两个:惩罚因子和节点个数 K.。2.4.增益回归树和随机森林增益回归树和随机森林 当我们试图在模型中考虑因子间相互关系时,一种方法是用因子的多元函数替代一元函数。如果选用 K Basis function,因子的数量会翻 K 倍,广义线性模型将变得难以计算。回归树是这种情况下常见的一种替代方法。每棵树需要数个步骤来,在每一步中,一个新的分支会根据一个因子把经过先前步骤后剩