分享
光大证券_20180806_多因子系列报告之十四:创新基本面因子财务数据间线性关系初窥.pdf
下载文档
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
光大 证券 _20180806_ 因子 系列 报告 十四 创新 基本面 财务数据 线性 关系
敬请参阅最后一页特别声明-1-证券研究报告 2018 年 8 月 6 日 金融工程 创新基本面因子:财务数据间线性关系初窥 多因子系列报告之十四 金融工程深度 最近两年开始,以往效果卓越的市值因子、量价类因子等都出现了有效性下滑的情况,价值投资的呼声也越来越高。愈来愈多的投资经理开始关注基本面因子。而过于简单直白的基本面因子其效果又差强人意。基于这样的现象与需求,我们开始深度研究创新基本面因子系列创新基本面因子系列。尝试通过一些更深入的研究,在保留直观逻辑意义的同时,更好地提取出蕴含在基本面数据中的有效预测信息。基本面因子有明显的优缺点基本面因子有明显的优缺点。单纯使用基本面数据构造的因子往往有以下优势:更加直接的信息源,更加直观的逻辑意义,更低的换手率,以更加直接的信息源,更加直观的逻辑意义,更低的换手率,以此构造的策略更大的市场容量,更慢的信息衰减速度此构造的策略更大的市场容量,更慢的信息衰减速度等等。而它的劣势也同样明显:传统基本面因子预测能力偏弱,存在财务造假风险,财务数传统基本面因子预测能力偏弱,存在财务造假风险,财务数据泄露风险等据泄露风险等。搭建财务数据间线性关系框架搭建财务数据间线性关系框架。在确定因子逻辑的前提下,利用 OLS 线性回归模型提取不同财务数据之间的线性信息。并根据逻辑,寻找合适的因子构造变量。同时,滚动回归窗口内财务数据标准化操作,以及财务数据覆盖度检验等细节处理使得该框架能更高效地研究开发新的基本面因子。RROC 因子预测能力突出因子预测能力突出。基于营业收入与营业成本线性关系的改变反映公司运营效率改善程度的逻辑。通过回归模型最后一期残差来构造的营业能力改善(RROC)因子,有着非常突出的预测能力,IC 均值 2.44%,月度 IR 值 0.66。基于该因子构造的多空组合在 2009 年至 2018 年 6 月期间年化收益 12.21%,夏普比率 2.12,最大回撤 8.90%。尤其是在 2017、2018 年,多空年化收益逾 20%,夏普比率超过 3,最大回撤仅 4.72%。中中性化后性化后 RROC 因子稳定性更进一步因子稳定性更进一步。通过与现有的主流因子作相关性测试,发现 RROC 与成长类因子 NP_YOY、市值因子与 ROE 因子有强正相关性。在经过横截面回归取残差的方式剔除上述因子对 RROC 因子的影响后,因子稳定性有了进一步提升,IC 均值为均值为 2.25%,而,而 IR 高达高达 0.82,中性化处理起到了信息提纯的作用。以中性化后 RROC 因子构建的多空组合,年化收益 7.53%,夏普比率高达夏普比率高达 2.46,最大回撤仅,最大回撤仅 3.22%。风险提示:风险提示:测试结果均基于模型和历史数据,模型存在失效的风险。分析师 刘均伟 (执业证书编号:S0930517040001)021-22169151 联系人 胡骥聪 021-22169125 相关研究 因子测试框架 多因子系列报告之一 因子测试全集 多因子系列报告之二 多因子组合“光大 Alpha 1.0”多因子系列报告之三 别开生面:公司治理因子详解 多因子系列报告之四 见微知著:成交量占比高频因子解析 多因子系列报告之五 行为金融因子:噪音交易者行为偏差 多因子系列报告之六 基于 K 线最短路径构造的非流动性因子 多因子系列报告之七 高频因子:日内分时成交量蕴藏玄机 多因子系列报告之八 一致交易:挖掘集体行为背后的收益 多因子系列报告之九 因子正交与择时:基于分类模型的动 态权重配置多因子系列报告之十 爬罗剔抉:一致预期因子分类与精选 多因子系列报告之十一 成长因子重构与优化:稳健加速为王 多因子系列报告之十二 组合优化算法探析及指数增强实证 多因子系列报告之十三 2018-08-06 金融工程 敬请参阅最后一页特别声明-2-证券研究报告 目目 录录 1、基本面因子的优与劣.5 1.1、基本面因子的优点.5 1.2、基本面因子的缺点.5 1.3、开发能扬长避短的创新基本面因子势在必行.6 2、财务数据之间线性关系.6 2.1、不同财务数据从逻辑上存在线性关系.6 2.2、搭建财务数据间线性关系研究框架.7 3、构建预测能力突出的 RROC 因子.8 3.1、成本与收入线性关系的改变反映企业营业能力变化.8 3.2、构建营业能力改善(RROC)因子.9 3.3、RROC 因子预测效果测试.10 3.4、RROC 选股能力优秀.15 4、RROC 因子相关性研究与提纯.20 4.1、RROC 因子与成长类因子高度相关.20 4.2、剔除相关因子后预测能力稳定性再上层楼.21 5、风险提示.24 2018-08-06 金融工程 敬请参阅最后一页特别声明-3-证券研究报告 图图目录目录 图 1:营业收入与营业成本线性关系逻辑示例图.9 图 2:各行业(中信一级)因子计算缺失值占比及有值率.10 图 3:不同参数下 IC 均值与 IR 的变化趋势.12 图 4:RROC 因子 IC 序列.12 图 5:RROC 在各中信一级行业上预测能力(除银行与非银行金融).13 图 6:RROC 因子分 5 组单调性.15 图 7:RROC 因子分 10 组单调性.15 图 8:RROC 因子组合相对中证 500 基准表现.16 图 9:RROC 因子选股组合月度平均换手率.17 图 10:不同交易成本下 RROC 因子组合净值表现.17 图 11:RROC 因子沪深 300 内分组及多空表现.18 图 12:RROC 因子沪深 300 内选股组合表现.18 图 13:RROC 因子中证 500 内分组及多空表现.19 图 14:RROC 因子中证 500 内选股组合表现.19 图 15:因子与其他大类因子历史 IC 值相关性检验.20 图 16:中性化后 RROC 因子 IC 序列.22 图 17:中性化后 RROC 因子分 5 组单调性.23 图 18:中性化后中证 500 内 RROC 因子组合相对中证 500 基准表现.24 2018-08-06 金融工程 敬请参阅最后一页特别声明-4-证券研究报告 表表目录目录 表 1:RROC 因子在不同季度数目 N 下的预测能力.11 表 2:RROC 因子在各中信一级行业下预测能力有所差异.13 表 3:因子分组回测框架.14 表 4:RROC 因子等分 5 组下分组统计数据.14 表 5:RROC 因子等分 10 组下分组统计数据.14 表 6:多空组合分年度统计数据.15 表 7:因子选股策略回测框架.15 表 8:RROC 选股组合分年度表现.16 表 9:不同交易成本下 RROC 因子组合统计数据.18 表 10:RROC 因子沪深 300 内选股组合分年度表现.18 表 11:RROC 因子中证 500 内选股组合分年度表现.19 表 12:RROC 因子与利润增速因子预测能力比较.21 表 13:中性化前后 RROC 因子的预测能力.22 表 14:中性化后 RROC 因子等分 5 组下分组统计数据.22 表 15:中性化后的 RROC 因子多空组合分年度统计数据.23 表 16:RROC 选股组合分年度表现.24 2018-08-06 金融工程 敬请参阅最后一页特别声明-5-证券研究报告 1、基本面因子的优与劣基本面因子的优与劣 基本面数据,顾名思义,是指描述一个公司某一方面基本情况的数据。它描述了财务状况、盈利状况、经营管理体制、人才构成等等各方面的现状。更多时候,当我们说基本面数据时,我们实际上是在特指公司报表上公布的财务数据。当我们使用这些财务数据来尝试预测各股票未来相对收益获取alpha 超额收益时,我们构建的因子便归属于基本面因子。由于基本面数据与量价数据在性质上有巨大差异,因此基本面因子与量价类因子在表现上往往很不一样。在这一章中,我们将概括基本面因子的一些主要优缺点。1.1、基本面基本面因子因子的优点的优点 更加直接的信息源更加直接的信息源:不同于量价因子尝试在市场交易数据中挖掘衍生信息,基本面数据直接从该股票的公司基本情况入手。更加直观的逻辑意义更加直观的逻辑意义:基本面数据直接体现了公司在某个属性或方面上的具体情况,因此利用基本面数据构造的因子往往都有比较明确的逻辑意义。更低的换手率更低的换手率:财务报告一年仅公布四次,因此一只股票的基本面因子一年最多改变 4 次。而由于上一年年报与该年的一季报的截止日期是同一天4 月 30 日,往往有时候不少公司基本面因子一年只有三个不同值。较少的因子值变化就造成基本面因子的换手往往显著低于其它类型的因子,尤其是量价因子。而低换手在构建多空组合时是很明显的优势,除了能减少交易次数与成本外,更大的好处在于它使得基本面因子对市场冲击是较小的,基于此构建的策略有更大的市场容量。更更慢的信息衰减速度慢的信息衰减速度:我们知道不少量价类因子的信息衰减速度是很快的,今天收盘时的信号,可能仅能覆盖之后几天的信息。这就意味着,该因子的表现对操作执行速度的要求很高,是在当日收盘调仓、还是在次日开盘调仓、亦或在一天后再调仓,可能效果会有非常大的差异。而基本面数据的改变频率低,其信号所覆盖的时间就会很长,信息衰减的速率较低,对操作执行速度的要求也很小。真正有效的基本面因子即使在发出信号后晚几天换仓,也不会有太大的损失。1.2、基本面基本面因子因子的缺点的缺点 传统基本面因子预测能力偏弱传统基本面因子预测能力偏弱:由于报表信息是完全公开的,而财务数据又十分直观,因此传统单纯使用基本面数据构造的因子大多预测能力偏弱。而那些有效性强的基本面因子,占比更多的是将基本面数据与市场数据进行了一定程度的结合,如 BP 估值因子。严格意义上来说,这样的因子不能算是基本面因子,从因子的特征上来说,更偏向于用基本面数据改进的量价因子或用基本面数据改进的衍生因子等。当然也有一些严格意义上的基本面因子表现很突出,如 ROE,NP_YOY 等,但总体个数并不多。财务造假风险财务造假风险:由于我们的因子计算是基于报表上的财务数据,因此如果数据上不能真实反映该公司的实际情况的话,那么因子的有效性就会大打折扣。而公司从自身利益的角度来说,是完全有足够的动机来进行财务造假2018-08-06 金融工程 敬请参阅最后一页特别声明-6-证券研究报告 的操作的。而财务造假的风险大小又与对于其监管的严格程度息息相关。因此长期来看,这个缺点虽然明显,但其严重程度在未来会随着中国市场越来越完善规范而变得越来越小。财务数据泄露风险财务数据泄露风险:如果公司的重大财务数据变化在公告前就已经泄露出去,那么市场就会提前有所反映,在一定程度上影响到使用该基本面数据的因子表现。同财务造假风险一样,该问题也会随着金融体系的规范而有所改善。1.3、开发能扬长开发能扬长避短的创新基本面因子势在必行避短的创新基本面因子势在必行 从以上的论述,我们已经了解到基本面数据有着直观的逻辑意义,但是像“低处的果实”(low-hanging fruit),所有过于简单直白的基本面因子早已被广大投资者测试与使用,直接拿基本面数据作为因子的预测效果整体也并非十分优秀。同时从最近两年开始,以往效果卓越的市值因子、量价类因子等都出现了有效性下滑的情况,价值投资的呼声也越来越高。愈来愈多的投资经理开始更加关注基本面因子。正是由于存在这样的现象与需求,我们开始撰写创新基本面因子系列创新基本面因子系列报告。尝试通过一些更深入的研究,在保留直观逻辑意义的同时,更好地提取出蕴含在基本面数据中的有效预测信息。该篇是创新基本面系列的第一篇报告,在接下来的篇幅中,我们首先将引入财务数据之间线性关系的研究框架,接着沿用该框架实现一个非常直观的逻辑、并构建基于该逻辑的基本面因子,最后会对该因子进行一系列的有效性及稳定性测试。2、财务数据之间线性关系财务数据之间线性关系 在该章节,我们将说明创新基本面系列的研究思路与框架。解释为什么我们从财务数据间线性关系入手,以及如何从财务数据间线性关系构思新的基本面因子。2.1、不同财务数据从逻辑上存不同财务数据从逻辑上存在线性关系在线性关系 观察目前主流的基本面因子,可以发现它们的构造方式主要可以分成以下几大类:1.目前因子数目最多的一类就是单纯使用一个或多个财务的截面数据,如果只用一个财务数据,就是单纯把财务数据当作因子,比如短期负债因子就是单纯拿短期负债这个数据作为因子。如果用了多个财务数据,往往是通过一些加减乘除的运算,将多个财务数据利用起来构造一个基本面因子,比如 EPS、ROA 等因子,就是将两个财务数据作比构造的。2018-08-06 金融工程 敬请参阅最后一页特别声明-7-证券研究报告 2.第二类就是在第一类基础上作差分。比如净利润增速因子,就是当期净利润减去上期净利润来构造。3.第三类是在第二类基础上作延伸,不仅仅使用两个数据点,而是利用更多时间序列上的数据来构造因子,比如光大金工在之前报告中开发的稳健加速度因子,就是拿最近 8 个季度的利润增速数据,计算它的均值与标准差的比值,类似计算利润增速的 Sharpe 比率。可以看出以上的因子构造方式是有一种递进关系在里面,每一类因子的构造方式都可以理解为在上一类的基础上作拓展或泛化(Generalization)。那再进一步,我们可以利用多个财务数据的时间序列的信息挖掘更深层次的信息。这时候我们需要考虑的第一个问题是,当我们手中有多个不同财务数据的时间序列数据,我们是利用线性模型还是非线性模型处理它们?虽然非线性模型也许能更好地挖出大量潜藏在角落里 alpha,但我们更希望找到的alpha 因子首先有比较清晰的逻辑意义。因此在创新基本面因子系列,我们将更多利用线性模型来寻找逻辑直观的基本面因子。财务报表中披露的财务数据总共有 300 个以上,这其中有许多财务数据之间是有着(或者说应该有着)鲜明的线性关系的。比如利润跟销量、收入跟成本、资产与负债等等。因此在逻辑上,利用这种不同财务数据间明显的线性关系构造的因子有较为直观的解释意义。2.2、搭建财务数据间搭建财务数据间线性关系研究框架线性关系研究框架 首先,确定一个蕴含在财务数据间线性关系的经济逻辑,或者经营逻辑。之后,当我们要研究两个或多个变量之间的线性关系时,最简单自然的想法便是使用 OLS 线性回归模型。在我们的框架里,如果我们认为基本面数据 Y 与基本面数据 A、B、C.在逻辑上有线性关系,或者 Y 的数值应当能被 A、B、C.解释,那就可以构造线性回归模型:=+#(1)或者,更常用的简化形式,仅考虑两个不同财务数据间的简单线性回归:=+#(2)在拟合好回归模型后,根据最开始的逻辑需要,找到可以反映或代理该逻辑的量化数据,比如是需要,还是需要拟合后的最后一期的残差,还是需要变量解释程度 2等等,甚至更进一步,这些描述线性关系的统计数据在时间序列上的性质等等。同时要说明的是,我们这样一个框架里,为了避免不同股票在回归时财务数据量级不同导致最终因子也受该量级的影响,所有的财务数据在滚动回归窗口里都是先进行标准化操作的。最后值得一提的是,由于不少财务数据并不是所有公司都会公布,有些财务指标仅相应行业的公司才有。因此我们的研究框架中是有因子覆盖度检查的,在全市场的因子开发中,只有通过覆盖度检查该因子才会被我们采纳。2018-08-06 金融工程 敬请参阅最后一页特别声明-8-证券研究报告 也正是因为不少行业有其独有的财务数据,我们的研究框架也除了全市场,也可以进行单行业基本面因子的开发。这些功能在我们该系列的后续报告中都将一一体现。3、构构建建预测能力突出预测能力突出的的 RROC 因子因子 基于上一章节所搭建的框架,其目的是便于我们能从不同财务数据的线性关系中挖掘出隐藏在其中的预测信息。在这一章里,我们将尝试从一个非常浅显明白的逻辑出发,构建一个基于不同财务数据间线性关系的因子,并测试其预测能力。3.1、成本与收入线性关系的改变成本与收入线性关系的改变反映反映企业企业营业能力变化营业能力变化 对于一个企业而言,我们假设它的所有属性(员工数、工作效率、运营方式、业务项目等等)完全不变的话,那么它运营能力也是不会发生变化的。也就是说,这个企业利用资源转化成收益的效率是不会变的,如果企业之前投入 10 万元能有 15 万元收入,那么现在投入 20 万元应该能有 30 万元收入。在理想情况下,投入与产出应该符合一个完美的线性关系。但实际上,任何企业都不会一成不变。可能一个企业因为引进或开发了新的工业技术从而变得更好;也有可能一个企业因为员工结构巨幅变动从而变得效率低下。无论是什么原因,对企业运营效率的改变都会破坏理想情况下投入与产出的线性关系。那么如果我们能够观察到历史一段时间一个企业投入与产出的线性关系变化的方向,那么我们就可以推断出这个企业在目前正在变得更好还是变得更糟,从而预测其相应股票股价在未来一段时间的运行方向。在基本面数据中,营业收入与营业成本都是能较为理想地体现出一个公司在一段时间的投入与产出的财务数据。因此我们可以通过将多个季度的营业收入序列在同期的营业成本序列上进行 OLS 线性回归,通过当季度的残差项来判断目前营业收入与营业成本之间线性关系的改变是朝着更好还是更坏的方向发展,以及发展的幅度有多大。为了更通俗易懂地解释以上逻辑,我们举个例子,假设在下面这张图里是一个公司最近 4 个季度的营业成本与营业收入数据,可以看出,除了当季度以外,在其它三个季度里,公司营业收入都是营业成本的 2 倍,如果该公司没有在运营能力上发生变化的话,当季度营业成本是 10 意味着当季度营业收入应该是 20,但实际上当季营业收入是 25,比 20 要多出 5,这表明该公司在当季度改善或者提高了它的运营能力与效率,提高的幅度就是 5。因此对于这样的公司,我们更加看好其未来股价的走势。2018-08-06 金融工程 敬请参阅最后一页特别声明-9-证券研究报告 图图 1:营业收入与营业成本线性关系逻辑示例图:营业收入与营业成本线性关系逻辑示例图 资料来源:光大证券研究所 3.2、构建营业能力构建营业能力改善改善(RROC)因子)因子 在详述了营业收入与营业成本线性关系的改变如何对应公司未来股价的运行之后,我们沿着这个逻辑去构建营业能力改善(RROC)因子,它的简称 RROC 是 Residual of Revenue On Cost 的首字母缩写,体现了该因子的构造方式。而具体的 RROC 因子构造方式,对于一支股票在某一天的因子值,其计算方式如下:1.获取在当天能够获得的最近 N 个季度的营业收入数据,作为营业收入样本(_),同样获取在当天能够获得的最近 N 个季度(或者说与营业收入样本相对应的季度)的营业成本数据,作为营业成本样本(_)。2.对营业收入样本与营业成本样本都做正态标准化处理,即:()=()#(3)3.将标准化后的营业收入样本在营业成本上进行 OLS 线性回归,即:=1+2+其中,0,1,1。将回归在最近一个季度上的残差0作为最终 RROC 在当天的因子值。由于我们是以残差项的值作为最终的因子值,所以第二步标准化的操作还是比较必要的。因为,在营业收入与营业成本上量级更大的公司,用它们的数据拟合出来的残差在量级上同样大于其它公司,因此如果不考虑到这一点,因子值绝对值大的(多头组合与空头组合)都会更加偏向于营业量级更大的公司。还有一处值得一提的就是,如果要计算一个公司的 RROC 因子,一个前提条件是该公司需要公布营业收入与营业成本这两个财务数据,少了这两项数据中任何一个,都会导致无法得到该公司的 RROC 因子值,从而变相地将其踢出了选股池。从 2009 年到如今,一共有 3257 只股票能计算出RROC 因子,而这段时间市场上可交易的股票有接近 3500 只,因此有些股2018-08-06 金融工程 敬请参阅最后一页特别声明-10-证券研究报告 票的确是没法计算出 RROC 因子值的,最明显的是银行与非银金融这两个行业。银行企业全部无法计算出该因子,而非银金融也有超过 6 成的公司没有该因子值。而非银金融有值的不到 4 成公司中,有许多皆是从其它行业转型成非银金融行业的。图图 2:各行业:各行业(中信一级)(中信一级)因子计算缺失值占比及有值率因子计算缺失值占比及有值率 资料来源:光大证券研究所,Wind 3.3、RROC 因子预测效果测试因子预测效果测试 在测试因子有效性及构建多空组合之前,我们会先对因子数据进行一定程度的清洗。对于因子数据的清洗和有效性检验在此前的多因子系列报告中已有详细阐述,这里仅作简单回顾。绝对中位数法去极值绝对中位数法去极值:在因子测试阶段,由于因子本身的分布是否为正态分布无法确定,我们采用稳健的 MAD(绝对中位数法)去除极值更加合适。截面截面标准化处理标准化处理:通过横截面 z-score 方法,以每个时间截面 t 上的所有股票的为样本,分别计算其均值和标准差得到如下所示 stand(factor)。此标准化方式属于因子的线性变换,并不会改变原始因子的分布特征。stand()=()#(4)有效性及稳定性检验有效性及稳定性检验:采用多期截面 RLM 回归后我们可以得到因子收益序列,以及每一期回归假设检验 T 检验的 t 统计量序列,针对这两个序列我们通过以下几个指标来判断该因子的有效性和稳定性:(1)因子收益序列的假设检验 t 统计量值 (2)因子收益序列大于 0 的概率 (3)t 统计量绝对值的均值 (4)t 统计量绝对值大于等于 2 的概率 0.0%10.0%20.0%30.0%40.0%50.0%60.0%70.0%80.0%90.0%100.0%石油石化煤炭有色金属电力及公用事业钢铁基础化工建筑建材轻工制造机械电力设备国防军工汽车商贸零售餐饮旅游家电纺织服装医药食品饮料农林牧渔银行非银行金融房地产交通运输电子元器件通信计算机传媒综合有值缺失2018-08-06 金融工程 敬请参阅最后一页特别声明-11-证券研究报告 有效性及预测能力检验有效性及预测能力检验:我们计算行业中性与市值中性处理后的 Rank IC(因子值与股票次月收益率的秩相关系数),通过以下几个与 IC 值相关的指标来判断因子的有效性和预测能力:(1)IC 值的均值(2)IC 值的标准差(3)IC 大于 0 的比例(4)IC 绝对值大于 0.02 的比例(5)IR(IR=IC 均值/IC 标准差)由于 RROC 因子在计算中有一个参数,回归的数据个数(或者说是使用的基本面数据季度数)。因此首先我们要确定该参数的取值,以及该参数的稳定性以及敏感性程度。我们在2009年1月至2018年6月区间内测试。从下表可以看出,RROC因子的预测能力对于使用季度数目在 4 个季度到 12 个季度之间时还是很稳定的,对于该参数的敏感程度并不高。IC 均值呈现开口向下的抛物线,而 IR值则更多呈现单调下降的趋势。相对而言,季度数目在 4 个到 8 个之间的时候因子预测性稍好,我们推测这可能意味着大部分中国上市公司的营业收入与营业成本之间在 1 年到 2 年内的线性关系是相对比较明显的。而在更长周期下,可能线性关系就比较薄弱了,如果想用更长周期的数据,也许使用非线性的模型也许会有不错的效果。最终考虑到季度数据的周期,我们选择参数 N=8,即使用正好最近 2 年的财务数据来计算 RROC 因子。表表 1:RROC 因子在不同季度数目因子在不同季度数目 N 下的预测能力下的预测能力 季度数目季度数目 N IC 均值均值 IC 标准差标准差 IC0 比例比例 IC0.02 比例比例 IR 值值 4 2.09%2.74%81.58%52.63%0.76 5 2.36%3.23%79.82%57.89%0.73 6 2.47%3.45%79.82%54.39%0.72 7 2.49%3.46%78.94%55.26%0.72 8 2.44%3.68%73.68%57.89%0.66 9 2.45%3.87%77.19%57.02%0.63 10 2.36%3.93%73.68%56.14%0.60 11 2.42%3.97%72.81%57.89%0.61 12 2.30%4.02%71.93%58.77%0.57 资料来源:光大证券研究所,Wind 注:样本区间为 2009 年 1 月至 2018 年 6 月 2018-08-06 金融工程 敬请参阅最后一页特别声明-12-证券研究报告 图图 3:不同参数下不同参数下 IC 均值与均值与 IR 的变化趋势的变化趋势 资料来源:光大证券研究所,Wind 在 N 取 8 时,RROC 因子的 IC 均值为 2.44%,IR 值为 0.66。单从该因子的月度 IC 均值大小来看,并不是十分突出,但其 IC 标准差也较小,因此 IR 的数值还是能让人眼前一亮,该因子预测能力的稳定性更加突出。图图 4:RROC 因子因子 IC 序列序列 资料来源:光大证券研究所,Wind 如果我们细看在每个行业中 RROC 因子的预测能力,会发现该因子在不同行业内的表现差异较大,在建筑、商贸零售与餐饮旅游上的表现较为糟糕,IC 均值绝对值小于 0.5%,基本没有预测能力,因子在非银行金融内有8.34%的 IC,但整个历史仅 19 只非银金融股票有过因子值,缺失值占比超6 成,因此它的 IC 值并不能反映实际预测效果,实际上我们看因子在非银行金融的 IR 就能发现实际上 IC 的波动性很大。除去非银行金融与银行两个对RROC 因子来说较为异常行业,在剩下行业中,因子 IC 均值在 3%以上的行业有 12 个,尤其是在建材、食品饮料这两个行业内的 IC 均值超过 4%,预测能力较强。0.000.100.200.300.400.500.600.700.801.50%1.70%1.90%2.10%2.30%2.50%2.70%456789101112IC均值IR(右轴)-0.1-0.0500.050.10.15Jan-09Jan-10Jan-11Jan-12Jan-13Jan-14Jan-15Jan-16Jan-17Jan-182018-08-06 金融工程 敬请参阅最后一页特别声明-13-证券研究报告 表表 2:RROC 因子在各因子在各中信中信一级行业下预测能力有所差异一级行业下预测能力有所差异 一级行业一级行业 IC IR 有有因子值公司数因子值公司数 缺失值占比缺失值占比 石油石化石油石化 3.14%0.16 45 2.20%煤炭煤炭 3.44%0.18 37 0.00%有色金属有色金属 3.84%0.26 99 4.80%电力及公用事业电力及公用事业 2.43%0.17 146 3.90%钢铁钢铁 2.34%0.11 52 0.00%基础化工基础化工 3.27%0.29 268 6.90%建筑建筑-0.43%-0.03 116 3.30%建材建材 4.07%0.26 86 3.40%轻工制造轻工制造 3.67%0.24 95 7.80%机械机械 2.44%0.24 321 5.00%电力设备电力设备 2.36%0.19 146 4.60%国防军工国防军工 3.92%0.17 48 5.90%汽车汽车 2.40%0.20 160 5.30%商贸零售商贸零售 0.06%0.01 95 1.00%餐饮旅游餐饮旅游 0.23%0.01 32 5.90%家电家电 3.42%0.19 73 1.40%纺织服装纺织服装 1.66%0.12 81 6.90%医药医药 3.52%0.34 254 8.00%食品饮料食品饮料 4.01%0.27 91 4.20%农林牧渔农林牧渔 2.18%0.14 90 1.10%银行银行 n/a n/a 0 100.00%非银行金融非银行金融 8.34%0.12 19 62.70%房地产房地产 1.81%0.18 151 0.00%交通运输交通运输 2.26%0.16 100 3.80%电子元器件电子元器件 3.81%0.35 195 6.30%通信通信 2.07%0.15 111 7.50%计算机计算机 2.90%0.25 180 3.20%传媒传媒 3.05%0.17 121 6.90%综合综合 1.68%0.09 37 2.60%资料来源:光大证券研究所,Wind 图图 5:RROC 在各在各中信一级中信一级行业上预测能力(除银行与非行业上预测能力(除银行与非银行银行金融)金融)资料来源:光大证券研究所,Wind-0.0500.050.10.150.20.250.30.350.4-1.00%-0.50%0.00%0.50%1.00%1.50%2.00%2.50%3.00%3.50%4.00%4.50%建材食品饮料国防军工有色金属电子元器件轻工制造医药煤炭家电基础化工石油石化传媒计算机机械电力及公用事业汽车电力设备钢铁交通运输农林牧渔通信房地产综合纺织服装餐饮旅游商贸零售建筑ICIR(右轴)2018-08-06 金融工程 敬请参阅最后一页特别声明-14-证券研究报告 除了有效性指标,因子的单调性和稳定性也是衡量因子选股效果的重要指标。我们建立如下表的分组回测框架,从分组选股效果角度来看因子的单调性,若单调性良好,则说明用该因子选股长期的效果具备较高的稳定性的。下表为因子分组回测阶段的框架说明。表表 3:因子分组回测框架:因子分组回测框架 因子分组回测框架因子分组回测框架 时间区间时间区间 2009 年 2 月 1 日至 2018 年 6 月 30 日 股票池股票池 全部 A 股(剔除选股日 ST/PT 股票;剔除上市不满一年的股票;剔除选股日由于停牌等因素无法买入的股票)调仓频率调仓频率 月度调仓 分组分组调仓方式调仓方式 每月最后一个交易日收盘后,根据本月所有未被剔除的股票数据计算因子值,根据因子值从小到大排序将股票等分为 5(或 10)组,分别计算每组股票的历史回测收益及多空组合收益。交易费率交易费率 因子测试阶段暂不考虑交易费用 资料来源:光大证券研究所 在等分5组的情况下,分组单调性十分优秀,因子越大的组合收益越大,区分程度也很显著。以第五组对冲第一组的方式构建多空组合,年化收益9.46%,年化波动仅 4.20%,最大回撤 7.80%,夏普比率高达 2.18。在等分 10 组的情况下,分组单调性同样比较优秀,但区分程度在个别组别之间并不是很明显,稍稍弱于等分 5 组的效果。若以第十组对冲第一组的方式构建多空组合,年化收益 12.21%,年化波动 5.52%,最大回撤 8.90%,夏普比率高达 2.12。可以看出,在分组划分更细的情况下,多空夏普比率变化不大,但明显收益与风险都有所增加。表表 4:RROC 因子等分因子等分 5 组下分组统计数据组下分组统计数据 第一组第一组 第二组第二组 第三组第三组 第四组第四组 第五组第五组 多空组合多空组合 年化收益年化收益 10.69%12.94%15.02%18.20%21.58%9.46%累计收益累计收益 1.52 2.02 2.57 3.58 4.92 1.28 年化波动率年化波动率 30.82%30.83%30.46%30.60%29.99%4.20%夏普比率夏普比率 0.49 0.55 0.61 0.70 0.80 2.18 最大回撤最大回撤 61.62%58.03%55.44%54.62%53.65%7.80%资料来源:光大证券研究所,Wind 表表 5:RROC 因子等分因子等分 10 组下分组统计数据组下分组统计数据 第一组第一组 第二组第二组 第三组第三组 第四组第四组 第五组第五组 第六组第六组 第七组第七组 第八组第八组 第九组第九组 第十组第十组 多空组合多空组合 年化收益年化收益 9.57%11.76%13.43%12.42%15.30%14.71%16.57%19.81%19.57%23.55%12.21%累计收益累计收益 1.30 1.75 2.15 1.90 2.65 2.48 3.03 4.18 4.08 5.84 1.85 年化波动率年化波动率 30.72%31.06%30.90%30.87%30.44%30.60%30.64%30.69%30.47%29.67%5.52%夏普比率夏普比率 0.45 0.52 0.56 0.54 0.62 0.60 0.66 0.74 0.74 0.86 2.12 最大回撤最大回撤 62.77%60.48%59.28%56.78%55.48%55.44%55.33%53.91%54.95%52.36%8.90%资料来源:光大证券研究所,Wind 2018-08-06 金融工程 敬请参阅最后一页特别声明-15-证券研究报告 图图 6:RROC 因子分因子分 5 组单调性组单调性 图图 7:RROC 因子分因子分 10 组单调性组单调性 资料来源:光大证券研究所,Wind 资料来源:光大证券研究所,Wind 对于多空组合,通过分年度统计的方式,我们可以清楚的看到组合在2009 年有相对较大回撤,而从 2010 年开始,组合回撤都控制得很好。在分5 组情况下的多空组合,在 2010 年后,最大回撤甚至再未达到过 4%。同时看出多空组合在近两年里(2017、2018)的表现极为优秀,分 10 组下的多空组合年化收益在这两年都超过 20%,夏普比率分别高达 4.36 与 2.96。而在 2009 年、2014 年与 2016 年组合表现平平,年化收益仅 1%到 5%左右。表表 6:多空组合分年度统计数据多空组合分年度统计数据 年份年份 分分 5 组情况下多空组合组情况下多空组合 分分 10 组情况下多空组合组情况下多空组合 年化收益率年化收益率 年化波动率年化波动率 夏普比率夏普比率 最大回撤最大回撤 年化收益率年化收益率 年化波动率年化波动率 夏普比率夏普比率 最大回撤最大回撤 2009 2.21%6.05%0.36 7.80%4.62%7.61%0.61 8.90%2010 8.77%3.62%2.42 2.03%13.44%4.79%2.81 2.22%2011 7.32%2.99%2.45 2.11%8.54%4.00%2.14 2.44%2012 9.26%4.59%2.02 3.88%10.72%5.79%1.85 5.36%2013 14.85%3.60%4.13 1.81%18.00%5.21%3.46 2.81%2014 1.34%2.94%0.45 2.77%1.44%4.13%0.35 4.58%2015 11.43%4.34%2.64 2.85%14.62%6.08%2.41 3.34%2016 2.68%3.26%0.82 3.39%3.11%4.28%0.73 5.30%2017 16.72%3.90%4.29 1.56%20.66%4.74%4.36 2.04%2018 15.87%5.38%2.95 3.55%20.93%7.06%2.96 4.72%资料来源:光大证券研究所,Wind 3.4、RROC 选股能力优秀选股能力优秀 通过对因子的有效性与稳定性检验,可以观察到 RROC 因子存在正的因子收益且与股票未来收益存在较强的正相关性,下面将以此为依据建立选股回测体系。后文的策略回测分析均基于此框架。后文的策略回测分析均基于此框架。表表 7:因子选股策略回测框架:因子选股策略回测框架 因子选股回测框架因子选股回测框架 回测时间区间回测时间区间 2009 年 2 月 1 日至 2018 年 6 月 30 日 0.91.11.31.51.71.92.12.32.50.02.04.06.08.010.012.0Feb-09Feb-10Feb-11Feb-12Feb-13Feb-14Feb-15Feb-16Feb-17Feb-18Group_1Group_2Group_3Group_4Group_5long_short(右轴)0.91.41.92.42.93.40.52.54.56.58.510.512.5Feb-09Feb-10Feb-11Feb-12Feb-13Feb-14Feb-15Feb-16Feb-17Feb-18Group_1G

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开