温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
证券
_20181214
因子
测试
一致
预期
谨请参阅尾页重要声明及华泰证券股票和行业评级标准 1 证券研究报告证券研究报告 金工研究/深度研究 2018年12月14日 林晓明林晓明 执业证书编号:S0570516010001 研究员 0755-82080134 陈烨陈烨 执业证书编号:S0570518080004 研究员 010-56793942 李子钰李子钰 联系人 1金工金工:估值因子在行业配置中的应用估值因子在行业配置中的应用2018.11 2 金工金工:对抗过拟合:从时序交叉验证谈起对抗过拟合:从时序交叉验证谈起2018.11 3金工金工:周期轮动下的周期轮动下的 BL 资产配置策略资产配置策略2018.11 华泰单因子测试之一致预期因子华泰单因子测试之一致预期因子 华泰多因子系列之九 一致一致预期因子及其衍生因子预期因子及其衍生因子长期来长期来看具有较稳定的选股能力看具有较稳定的选股能力 分析师一致预期数据归纳总结了市场上卖方分析师报告对个股的财务指标预测、评级以及关注情况,是除公司财报数据、交易数据以外重要的第三方数据,我们基于朝阳永续一致预期数据库,进行一致预期因子的构建和测试。本文主要测试了两大类一致预期因子:财务指标类一致预期因子和关注度类一致预期因子,总共 19 个因子。根据测试结果,一致预期因子及其衍生因子长期来看具有较稳定的选股能力。财务指标类一致预期因子的衍生因子选股表现相比原始因子各有优劣财务指标类一致预期因子的衍生因子选股表现相比原始因子各有优劣 对于财务指标类的一致预期因子,我们都构建了两个衍生因子:原始因子的同行业位序和原始因子的季度环比,该类因子 2009 年以来的覆盖度基本在 90%左右。测试分析可得两条主要结论:(1)原始因子与其同行业位序因子相关性较高,大多数情况下,同行业位序因子的 RankIC 均值相比原始因子会有一定降低,但是 IC_IR 会有较大提升,分层测试表现更加稳定。(2)原始因子与其季度环比因子相关性较低,大多数情况下,季度环比因子会比原始因子有更高的 IC_IR 和多空组合夏普比率,但是换手率也更高,其多空组合的良好表现多数情况下来自于空头。财务指标类财务指标类一致预期因子选股表现排序:一致预期因子选股表现排序:沪深沪深 300全全 A中证中证 500 对于财务指标类的一致预期因子,我们分为沪深 300、中证 500、全 A 三个股票池测试,并总结各个股票池内表现较好的因子。总体来看,三个股票池内一致预期因子效果排序为:沪深 300全 A中证 500。其中沪深 300内 RankIC 均值最高的因子是一致预期 EP,RankIC 均值为 6.32%,IC_IR为 0.33,多空组合夏普比率为 0.79。中证 500 内 RankIC 均值最高的因子是一致预期 BP,RankIC 均值为 4.60%,IC_IR 为 0.26,多空组合夏普比率为 0.93。全 A 内 RankIC 均值最高的因子是一致预期 BP 同行业位序,RankIC 均值为 4.78%,IC_IR 为 0.67,多空组合夏普比率为 1.94。关注度关注度类类一致预期因子覆盖度较低,选股效果一般一致预期因子覆盖度较低,选股效果一般 对于关注度类的一致预期因子,考虑到其较低的覆盖率问题,我们仅测试该类因子在沪深 300 和中证 500 成分股内的选股效果。测试发现该类因子表现并不亮眼,其中个股季度买入评级报告数因子在沪深 300 内表现较好,RankIC 均值为 4.33%,IC_IR 为 0.26,多空组合夏普比率为 0.81。一致预期因子在银行行业内表现最好一致预期因子在银行行业内表现最好 我们测试了一致预期因子在行业内选股的表现,根据测试的 RankIC 均值和多空组合夏普比率进行综合排名。一致预期因子在银行行业内表现最好,有 6 个因子排名进入前 50,其中 4 个因子的 RankIC 在 10%以上,多空组合夏普比率在 1 以上。另外一致预期因子在电子元器件、农林牧渔、餐饮旅游、汽车、纺织服装行业的表现也较好。一致预期 EP 和一致预期 BP的相关因子在行业内选股表现较好,一致预期 ROE 相关因子只在银行行业内选股排名进入前 50,一致预期 EPS 和一致预期归母净利润相关因子没有一个排名进入前 50。风险提示:单因子测试结果是历史经验的总结,如果市场规律改变,存在失效的可能。一致预期因子的有效性可能吸引越来越多投资者的关注,逐渐削弱一致预期因子在未来的表现。相关研究相关研究 金工研究/深度研究|2018 年 12 月 14 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 2 正文目录正文目录 一致预期因子的选取及测试框架.5 一致预期因子的选取.5 一致预期因子的构建和测试框架.5 一致预期因子的行业间差异.6 一致预期因子与市值因子的相关性.7 一致预期因子在截面上的因子值相关性分析.7 单因子测试方法简介.8 单因子测试方法简介.8 回归法.8 IC 值分析法.9 分层回测法.9 三种方法的关系.10 宽基指数内单因子测试结果分析.11 一致预期 EP.11 沪深 300 成分股内表现较好的一致预期 EP 相关因子详细展示.12 中证 500 成分股内表现较好的一致预期 EP 相关因子详细展示.13 全 A 股内表现较好因子的一致预期 EP 相关因子详细展示.13 一致预期 BP.13 沪深 300 成分股内表现较好的一致预期 BP 相关因子详细展示.15 中证 500 成分股内表现较好的一致预期 BP 相关因子详细展示.15 全 A 股内表现较好因子的一致预期 BP 相关因子详细展示.16 一致预期 EPS.16 沪深 300 成分股内表现较好的一致预期 EPS 相关因子详细展示.18 全 A 股内表现的一致预期 EPS 相关因子详细展示.18 一致预期 ROE.18 全 A 股内表现较好因子的一致预期 ROE 相关因子详细展示.20 一致预期归母净利润.20 全 A 股内表现较好因子的一致预期归母净利润相关因子详细展示.21 一致预期个股关注度因子.22 沪深 300 成分股内表现较好的一致预期个股关注度因子详细展示.23 各股票池内表现较好的一致预期因子总结.23 行业内单因子测试结果分析.25 总结.28 风险提示.28 金工研究/深度研究|2018 年 12 月 14 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 3 图表目录图表目录 图表 1:本文测试的一致预期因子及其描述(财务指标类).5 图表 2:本文测试的一致预期因子数据及其描述(关注度类).5 图表 3:一致预期因子分析测试框架.6 图表 4:各一级行业 CON_EP、CON_BP 因子中位数比较(2018 年 10 月 31 日).6 图表 5:一致预期因子与市值因子之间 Spearman 秩相关系数(根据每年年底的因子值和市值进行计算).7 图表 6:一致预期因子在截面上的两两因子值 Spearman 秩相关系数均值(2009 年至今2018 年 10 月).7 图表 7:一致预期 EP 相关因子.11 图表 8:一致预期 EP 因子和 EP 因子在截面上的 Spearman 秩相关系数均值(2009 年至 2018 年 10 月).11 图表 9:一致预期 EP 相关因子在各种股票池内回归法、IC 值分析结果汇总(行业、市值、EP 中性).11 图表 10:一致预期 EP 相关因子在各种股票池内分层测试法结果汇总(分五层).12 图表 11:CON_EP 分层组合 15 净值除以基准净值(沪深 300).12 图表 12:CON_EP 累积 RankIC 和累积因子收益率(沪深 300).12 图表 13:CON_EP_RANK 分层组合 15 净值除以基准净值(沪深 300).12 图表 14:CON_EP_RANK 累积 RankIC 和累积因子收益率(沪深 300).12 图表 15:CON_EP_RANK 分层组合 15 净值除以基准净值(中证 500).13 图表 16:CON_EP_RANK 累积 RankIC 和累积因子收益率(中证 500).13 图表 17:CON_EP_RANK 分层组合 15 净值除以基准净值(全 A).13 图表 18:CON_EP_RANK 累积 RankIC 和累积因子收益率(全 A).13 图表 19:一致预期 BP 相关因子.13 图表 20:一致预期 BP 因子和 BP 因子在截面上的 Spearman 秩相关系数均值(2009 年至 2018 年 10 月).14 图表 21:一致预期 BP 相关因子在各种股票池内回归法、IC 值分析结果汇总(行业、市值、BP 中性).14 图表 22:一致预期 BP 相关因子在各种股票池内分层测试法结果汇总(分五层).14 图表 23:CON_BP 分层组合 15 净值除以基准净值(沪深 300).15 图表 24:CON_BP 累积 RankIC 和累积因子收益率(沪深 300).15 图表 25:CON_BP_RANK 分层组合 15 净值除以基准净值(沪深 300).15 图表 26:CON_BP_RANK 累积 RankIC 和累积因子收益率(沪深 300).15 图表 27:CON_BP 分层组合 15 净值除以基准净值(中证 500).15 图表 28:CON_BP 累积 RankIC 和累积因子收益率(中证 500).15 图表 29:CON_BP_RANK 分层组合 15 净值除以基准净值(中证 500).16 图表 30:CON_BP_RANK 累积 RankIC 和累积因子收益率(中证 500).16 图表 31:CON_BP_RANK 分层组合 15 净值除以基准净值(全 A).16 图表 32:CON_BP_RANK 累积 RankIC 和累积因子收益率(全 A).16 图表 33:一致预期 EPS 相关因子.16 图表 34:一致预期 EPS 因子和 EPS 因子在截面上的 Spearman 秩相关系数均值(2009年至 2018 年 10 月).17 金工研究/深度研究|2018 年 12 月 14 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 4 图表 35:一致预期 EPS 相关因子在各种股票池内回归法、IC 值分析结果汇总(行业、市值、EPS 中性).17 图表 36:一致预期 EPS 相关因子在各种股票池内分层测试法结果汇总(分五层).17 图表 37:CON_EPS 分层组合 15 净值除以基准净值(沪深 300).18 图表 38:CON_EPS 累积 RankIC 和累积因子收益率(沪深 300).18 图表 39:CON_EPS_REL 分层组合 15 净值除以基准净值(全 A).18 图表 40:CON_EPS_REL 累积 RankIC 和累积因子收益率(全 A).18 图表 41:一致预期 ROE 相关因子.18 图表 42:一致预期 ROE 因子和 ROE 因子在截面上的 Spearman 秩相关系数均值(2009年至 2018 年 10 月).19 图表 43:一致预期 ROE 相关因子在各种股票池内回归法、IC 值分析结果汇总(行业、市值、ROE 中性).19 图表 44:一致预期 ROE 相关因子在各种股票池内分层测试法结果汇总(分五层).19 图表 45:CON_ROE_REL 分层组合 15 净值除以基准净值(全 A).20 图表 46:CON_ROE_REL 累积 RankIC 和累积因子收益率(全 A).20 图表 47:一致预期归母净利润相关因子.20 图表48:一致预期归母净利润因子和净利润在截面上的Spearman秩相关系数均值(2009年至 2018 年 10 月).20 图表 49:一致预期归母净利润相关因子在各种股票池内回归法、IC 值分析结果汇总(行业、市值、ROE 中性).21 图表 50:一致预期归母净利润相关因子在各种股票池内分层测试法结果汇总(分五层).21 图表 51:CON_NP_REL 分层组合 15 净值除以基准净值(全 A).21 图表 52:CON_NP_REL 累积 RankIC 和累积因子收益率(全 A).21 图表 53:一致预期个股关注度因子.22 图表 54:一致预期个股关注度相关因子在各种股票池内回归法、IC 值分析结果汇总(行业、市值中性).22 图表 55:一致预期个股关注度相关因子在各种股票池内分层测试法结果汇总(分五层).22 图表 56:BUY_NUMBER 分层组合 15 净值除以基准净值(沪深 300).23 图表 57:BUY_NUMBER 累积 RankIC 和累积因子收益率(沪深 300).23 图表 58:沪深 300 内表现较好的一致预期因子.23 图表 59:沪深 300 内表现较好的一致预期因子多空组合净值.23 图表 60:中证 500 内表现较好的一致预期因子.24 图表 61:中证 500 内表现较好的一致预期因子多空组合净值.24 图表 62:全 A 内表现较好的一致预期因子.24 图表 63:全 A 内表现较好的一致预期因子多空组合净值.24 图表 64:进行行业内选股测试的一致预期因子.25 图表 65:一致预期因子在行业内选股的表现(根据测试的 RankIC 均值和多空组合夏普比率取排名前 50 的因子).26 金工研究/深度研究|2018 年 12 月 14 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 5 一致预期一致预期因子的选取及测试框架因子的选取及测试框架 一致预期因子的选取一致预期因子的选取 本文是华泰多因子系列研究第九篇,是单因子测试系列的第八篇,在多因子系列首篇报告 中,我们系统地阐述了多因子模型的基本理论,详细描述了多因子模型构建的流程,从多 因子系列第二篇报告开始,我们对不同的风格因子单独进行详细的研究和检验,通过综合 对比评价,筛选出能持续获得稳健收益的优质因子,这正是构建多因子选股模型的关键一 步。在前七篇单因子测试报告中,我们对估值因子(Value Factor)、成长因子(Growth Factor)、动量反转因子(Momentum Factor)、换手率因子(Turnover Factor)、波动率 因子(Volatility Factor)、资金流向因子(Money Flow Factor)、财务质量因子(Financial Quality Factor)进行了详细的测试分析。在本文中,我们将基于朝阳永续数据库,对分析师一致预期相关因子进行系统全面的分析,我们先根据分析师一致预期数据的来源和特点进行一致预期因子的分类和构建,然后通过回归法、IC 值分析、分层测试法等方法检验各类因子的有效性,探讨各因子的优缺点,并汇总对比一致预期因子与其它主要类别因子效果的异同。分析师一致预期数据归纳总结了市场上卖方分析师报告对个股的财务指标预测、评级以及关注情况,是除公司财报数据、交易数据以外重要的第三方数据,蕴含丰富的信息,本文中,我们使用朝阳永续一致预期数据库进行研究。对于财务指标类因子,在考虑了因子的有效性和覆盖度后,选取图表 1 中的因子进行衍生因子的构造和测试。图表图表1:本文测试的一致预期本文测试的一致预期因子及其描述因子及其描述(财务指标类)(财务指标类)具体因子具体因子 因子名称因子名称 因子数据来源描述因子数据来源描述 一致预期归母净利润 CON_NP 一般在分析师报告中直接披露 一致预期 EPS CON_EPS 一般在分析师报告中直接披露 一致预期 EP CON_EP 一致预期 EPS/统计日收盘价 一致预期 BP CON_BP 一致预期净资产/统计日收盘价 一致预期 ROE CON_ROE 一致预期净利润/一致预期净资产 资料来源:朝阳永续,华泰证券研究所 朝阳永续数据库中还统计了一段时间内所有卖方分析师和机构对个股的关注度数据,在考虑了因子的有效性和覆盖度后,本文选取图表2中的因子数据进行衍生因子的构造和测试。图表图表2:本文测试的一致预期本文测试的一致预期因子因子数据数据及其描述及其描述(关注度类)(关注度类)具体因子具体因子 因子英文名称因子英文名称 因子数据来源描述因子数据来源描述 个股季度报告数 REPORT_NUMBER 个股季度报告数量 个股季度关注研究员数 AUTHOR_NUMBER 个股季度关注的研究员数量 个股季度机构覆盖数 ORGAN_NUMBER 个股季度至少有一篇报告记录的机构总量 个股季度买入评级报告数 BUY_NUMBER 个股季度买入评级报告数 资料来源:朝阳永续,华泰证券研究所 一致预期因子的构建和测试框架一致预期因子的构建和测试框架 对于财务指标类的一致预期因子,我们不直接从基础的分析师报告数据开始构建因子,而是使用朝阳永续的一致预期数据表(CON_FORECAST_STK)进行因子构建。以股票000001.SZ 的一致预期 EPS 因子为例,在 2018 年 10 月 31 日这天,一致预期数据表会记录该股票未来 3 年(2018、2019、2020)的一致预期 EPS 因子值,该因子值并非单一分析师报告的预测 EPS,而是通过对过去一段时间内所有卖方分析师相关报告中的预测EPS 进行加权,得到加权后的一致预期 EPS 因子数据。在本文中,我们统一使用最远预测年份的一致预期因子数据(例如对上面的例子来说,使用 2020 年的一致预期因子数据)。金工研究/深度研究|2018 年 12 月 14 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 6 对 于 关 注 度 类 的 一 致 预 期 因 子,我 们 使 用 朝 阳 永 续 的 个 股 报 告 数 表(STOCK_REPORT_NUMBER)进行因子构建,由于市场上股票数量较多而分析师有限,为了提高因子的覆盖度,对于图表 2 中提到的因子,我们都取用季度的统计数据进行因子构建。在本报告中,我们首先观察一致预期因子在 A 股市场的分布规律,通过分析一致预期因子在不同行业及不同规模上市公司间的差异,判断在单因子回归测试中是否应该处理行业、规模因素的影响。随后我们将使用分层测试法、回归法、IC 值分析等手段对因子进行全面测试,详细观察因子区分度、单调性等规律,选出有效且稳健的因子。最后我们将根据以上测试结果进行综合分析,并与之前测试过的其它类别因子进行对比。一致预期一致预期因子的因子的行业间差异行业间差异 一致预期因子在不同行业间存在一定差异。我们选取CON_EP(一致预期EP)、CON_BP(一致预期 BP)作为代表,计算它们在 2018 年 10 月 31 日的行业中位数,如下图所示。可以发现,银行行业具有较高的 CON_EP 和 CON_BP,国防军工行业的 CON_EP 和 CON_BP都较低,这两个因子在不同行业间的水平存在一定差异。我们认为对上市公司直接进行跨行业比较意义不大,在单因子测试中还是应考虑行业中性处理。图表图表4:各一级行业各一级行业 CON_EP、CON_BP 因子因子中位数比较(中位数比较(2018 年年 10 月月 31 日日)资料来源:朝阳永续,华泰证券研究所 00.20.40.60.811.21.41.61.800.020.040.060.080.10.120.140.160.180.2煤炭交通运输房地产电力及公用事业机械电力设备有色金属基础化工商贸零售建筑轻工制造综合医药纺织服装食品饮料家电汽车电子元器件建材餐饮旅游石油石化国防军工农林牧渔钢铁通信计算机非银行金融传媒银行CON_EPCON_BP图表图表3:一致预期一致预期因子分析测试框架因子分析测试框架 资料来源:华泰证券研究所 一致预期一致预期因子因子(如一致预期EP、一致预期BP等)A股市场分布规律股市场分布规律a)行业间因子差异b)不同规模公司间因子差异c)各因子间相关性单因子分层回测单因子分层回测a)观察单因子区分度、单调性等b)观察多空组合收益率、稳定性c)观察不同股票池、不同行业里因子分层测试绩效单因子回归分析以单因子回归分析以及及IC值分析值分析a)观察收益率序列、t值序列的绝对值大小及稳定性b)观察因子IC值随时间变化规律测试结果对比总结测试结果对比总结将分层回测、回归分析以及IC值分析的结果综合对比,探讨各因子的优势与缺点;与之前测试过的其它因子进行对比 金工研究/深度研究|2018 年 12 月 14 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 7 上图说明了,在同一时间点,不同行业间一致预期因子的水平存在一定差异。事实上,随着时间变化,金融系统存在波动,同一行业的一致预期因子的绝对大小和与其他行业对比的相对大小也在不断变化中。这里就不具体举例了。一致预期一致预期因子因子与市值因子的相关性与市值因子的相关性 除去行业对因子存在较大影响外,上市公司的规模也是对各因子产生作用的潜在因素。我们在之前单因子测试报告中涉及的大部分因子都与市值因子具有一定相关性,下面我们将对一致预期因子与市值因子的相关性进行详细计算。图表图表5:一致预期因子一致预期因子与市值因子之间与市值因子之间 Spearman 秩秩相关系数相关系数(根据每年年底的因子值和市值进行计算)(根据每年年底的因子值和市值进行计算)因子名称因子名称 2009 2010 2011 2012 2013 2014 2015 2016 2017 均值均值 CON_NP 85.34%84.72%85.72%84.41%81.31%79.59%73.18%79.57%84.02%81.98%CON_EP 44.48%39.06%33.38%23.03%25.41%23.57%23.98%40.50%29.76%31.46%CON_BP 17.29%12.59%10.16%1.48%1.94%10.76%6.85%28.47%18.33%11.99%CON_EPS 44.92%39.32%29.66%25.31%36.67%25.28%23.75%25.93%23.03%30.43%CON_ROE 35.14%36.32%33.94%28.12%32.77%23.55%24.86%19.66%16.85%27.91%REPORT_NUMBER 59.54%62.41%52.75%52.34%60.27%49.23%49.48%45.31%55.55%54.10%AUTHOR_NUMBER 66.69%67.63%59.89%57.56%64.31%54.82%51.54%49.18%58.48%58.90%ORGAN_NUMBER 65.81%66.44%59.53%57.06%64.22%55.08%53.03%50.64%59.30%59.01%BUY_NUMBER 60.54%61.71%55.09%49.20%56.41%48.57%46.78%45.91%55.32%53.28%资料来源:朝阳永续,Wind,华泰证券研究所 我们针对图表 5 中的 9 个因子,计算它们在 20092017 年最后一个交易日与对应时间市值因子之间的 Spearman 秩相关系数,见上表。经观察发现,所有因子与市值具有正相关关系,CON_EP、CON_BP、CON_EPS、CON_ROE 与市值相关性较小,CON_NP、REPORT_NUMBER、AUTHOR_NUMBER、ORGAN_NUMBER、BUY_NUMBER 与市值相关性较大。由此,我们认为在一致预期因子测试中还是应考虑进行市值中性处理。一致预期因子在截面上的因子值相关性分析一致预期因子在截面上的因子值相关性分析 在某一指定截面上,我们可以计算两个因子的因子值之间相关系数。若在这一截面上建立多元线性回归方程,以下期收益作为被解释变量,以这两个因子和其它一些风格因子作为解释变量,则由于这两个因子的线性相关程度较大,回归结果的准确性就会受到影响,当这两个因子完全线性相关时回归方程没有解。所以考察截面上因子值相关情况是一件有意义的工作。对于任意两个一致预期因子,我们依次计算从 2009 年至 2019 年的 10 月月末截面上它们之间的 Spearman 秩相关系数,最后求均值,结果见下表。关注度类的一致预期因子(REPORT_NUMBER,AUTHOR_NUMBER,ORGAN_NUMBER,BUY_NUMBER)之间的相关性较大,在使用时仍需注意规避因子共线性带来的一些衍生问题。CON_BP(一致预期 BP)和其他因子的相关性较低。图表图表6:一致预期因子在截面上的两两因子值一致预期因子在截面上的两两因子值 Spearman 秩相关系数均值秩相关系数均值(2009 年至今年至今 2018 年年 10 月月)因子序号因子序号 因子名称因子名称 因子因子 1 因子因子 2 因子因子 3 因子因子 4 因子因子 5 因子因子 6 因子因子 7 因子因子 8 因子因子 9 因子因子 1 CON_NP 74.05%36.37%56.73%52.92%56.57%60.55%60.48%59.06%因子因子 2 CON_EP 74.05%57.08%62.60%57.45%37.73%38.47%38.30%42.41%因子因子 3 CON_BP 36.37%57.08%6.74%-23.05%8.68%11.80%11.91%6.90%因子因子 4 CON_EPS 56.73%62.60%6.74%70.64%53.67%52.59%52.92%54.46%因子因子 5 CON_ROE 52.92%57.45%-23.05%70.64%39.88%38.30%37.94%46.25%因子因子 6 REPORT_NUMBER 56.57%37.73%8.68%53.67%39.88%91.87%92.67%83.96%因子因子 7 AUTHOR_NUMBER 60.55%38.47%11.80%52.59%38.30%91.87%98.57%82.64%因子因子 8 ORGAN_NUMBER 60.48%38.30%11.91%52.92%37.94%92.67%98.57%82.70%因子因子 9 BUY_NUMBER 59.06%42.41%6.90%54.46%46.25%83.96%82.64%82.70%资料来源:朝阳永续,华泰证券研究所 金工研究/深度研究|2018 年 12 月 14 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 8 单因子测试方法简介单因子测试方法简介 在多因子系列首篇报告华泰多因子模型体系初探(2016.09)中,我们系统地介绍了有效因子识别(即单因子测试)的理论基础和研究思路,在多因子系列第二篇报告华泰单因子测试之估值类因子中我们着眼于实践过程,给出了详细的流程操作说明。本篇报告将沿用多因子系列第二篇报告的方法,对分析师一致预期因子进行月度调仓情况下的单因子测试。单因子测试方法简介单因子测试方法简介 回归法回归法 回归法是一种最常用的测试因子有效性的方法,具体做法是将第T期的因子暴露度向量与T+1期的股票收益向量进行线性回归,所得到的回归系数即为因子在T期的因子收益率,同时还能得到该因子收益率在本期回归中的显著度水平t 值。在某截面期上的个股的因子暴露度(Factor Exposure)即指当前时刻个股在该因子上的因子值。第T期的回归模型具体表达式如下。+1=+_T+1:所有个股在第 T+1 期的收益率向量:所有个股第 T 期在被测单因子上的暴露度向量:所有个股第 T 期在第 j 个行业因子上的暴露度向量(0/1 哑变量)_T:所有个股第 T 期在对数市值因子上的暴露度向量,:对应因子收益率,待拟合常数,通常比较关注:残差向量 在所有截面期上,我们对因子 X 进行回归测试,能够得到该因子的因子收益率序列(即所有截面期回归系数构成的序列)和对应的 t 值序列。t 值指的是对单个回归系数的 t检验统计量,描述的是单个变量显著性,t 值的绝对值大于临界值说明该变量是显著的,即该解释变量(T期个股在因子 X 的暴露度)是真正影响因变量(T+1期个股收益率)的一个因素。也就是说,在每个截面期上,对于每个因子的回归方程,我们设 假设检验0:=0 备择假设1:0 该假设检验对应的 t 统计量为 t=()其中()代表回归系数的标准差的无偏估计量。一般 t 值绝对值大于 2 我们就认为本期回归系数是显著异于零的(也就是说,本期因子 X 对下期收益率具有显著的解释作用)。注意,我们在回归模型中加入了市值、行业因子,能在一定程度上规避市值、行业因素对财务质量因子的影响。回归模型构建方法如下:1 股票池:全 A 股,沪深 300 成分股,中证 500 成分股,剔除 ST、PT 股票,剔除每个截面期下一交易日停牌的股票。2 回溯区间:2009-01-31 至 2018-10-31。3 截面期:每个月月末,用当前截面期因子值与当前截面期至下个截面期内的个股收益进行回归。4 数据处理方法:a)因子列表见图表 1 和图表 2,所有因子先从朝阳永续数据库下载,再处理成月频因子;金工研究/深度研究|2018 年 12 月 14 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 9 b)中位数去极值:设第 T 期某因子在所有个股上的暴露度向量为,为该向量中位数,1为向量|的中位数,则将向量中所有大于+51的数重设为+51,将向量中所有小于 51的数重设为 51;c)标准化:将去极值处理后的因子暴露度序列减去其现在的均值、除以其标准差,得到一个新的近似服从N(0,1)分布的序列,这样做可以让不同因子的暴露度之间具有可比性;d)缺失值处理:因本文主旨为单因子测试,为了不干扰测试结果,如文中未特殊指明均不填补缺失值(在构建完整多因子模型时需考虑填补缺失值)。5 回归权重:由于普通最小二乘回归(OLS)可能会夸大小盘股的影响(因为小盘股的财务质量因子出现极端值概率较大,且小盘股数目很多,但占全市场的交易量比重较小),并且回归可能存在异方差性,故我们参考 Barra 手册,采用加权最小二乘回归(WLS),使用个股流通市值的平方根作为权重,此举也有利于消除异方差性。6 因子评价方法:a)t 值序列绝对值均值因子显著性的重要判据;b)t 值序列绝对值大于 2 的占比判断因子的显著性是否稳定;c)t 值序列均值与 a)结合,能判断因子 t 值正负方向是否稳定;d)因子收益率序列均值判断因子收益率的大小。IC 值分析法值分析法 因子的 IC 值是指因子在第 T 期的暴露度向量与 T+1 期的股票收益向量的相关系数,即=corr(+1,)上式中因子暴露度向量一般不会直接采用原始因子值,而是经过去极值、中性化等手段处理之后的因子值。在实际计算中,使用 Pearson 相关系数可能受因子极端值影响较大,使用 Spearman 秩相关系数则更稳健一些,这种方式下计算出来的 IC 一般称为 Rank IC。IC 值分析模型构建方法如下:1.股票池、回溯区间、截面期均与回归法相同。2.因子暴露度向量先用中位数法去极值(方法论详见上一小节),然后进行市值、行业中性化处理。中性化处理即在截面期 T 上用因子值(已去极值)做因变量、对数总市值因子(已去极值)及行业因子(0/1 哑变量)做自变量进行线性回归,取残差作为因子值的一个替代。这样做可以消除行业因素和市值因素对因子的影响。计算残差向量和 T+1 期股票收益向量的 Spearman 秩相关系数作为 T 期因子 Rank IC 值。3.因子评价方法:a)Rank IC 值序列均值因子显著性;b)Rank IC 值序列标准差因子稳定性;c)IC_IR(Rank IC 值序列均值与标准差的比值)因子有效性;d)Rank IC 值序列大于零的占比因子作用方向是否稳定。分层回测法分层回测法 依照因子值对股票进行打分,构建投资组合回测,是最直观的衡量因子优劣的手段。分层测试法与回归法、IC 值分析相比,能够发掘因子对收益预测的非线性规律。也即,若存在一个因子分层测试结果显示,其 Top 组和 Bottom 组的绩效长期稳定地差于 Middle 组,则该因子对收益预测存在稳定的非线性规律,但在回归法和 IC 值分析过程中很可能被判定为无效因子。金工研究/深度研究|2018 年 12 月 14 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 10 分层测试模型构建方法如下:1.股票池、回溯区间、截面期均与回归法相同。2.换仓:在每个截面期核算因子值,构建分层组合,在截面期下一个交易日按当日收盘价换仓,交易费用以双边千分之四计。3.分层方法:因子暴露度向量先用中位数法去极值,然后进行市值、行业中性化处理(方法论详见上一小节),将股票池内所有个股按因子从大到小进行排序,等分 N 层,每层内部的个股等权配置。当个股总数目无法被 N 整除时采用任一种近似方法处理均可,实际上对分层组合的回测结果影响很小。4.多空组合收益计算方法:用 Top 组每天的收益减去 Bottom 组每天的收益,得到每日多空收益序列1,2,,则多空组合在第 n 天的净值等于(1+1)(1+2)(1+)。5.评价方法:全部 N 层组合年化收益率(观察是否单调变化),多空组合的年化收益率、夏普比率、最大回撤、月胜率等。三种方法的关系三种方法的关系 首先介绍一下回归法和 IC 值分析法之间的关系。我们先介绍一个引理。设,为两个向量,则(,)2=2,其中2为线性回归=+或线性回归X=+的可决系数(其中,是待回归系数)。如果我们在单因子测试(线性回归法)中使用模型 =+(r 是股票收益率,X 是因子暴露度,c 是常数项,c 可以理解为市场因子)并且假设我们在计算因子 IC 值的时候,不预先对因子暴露度进行市值、行业调整了,就使用原始的因子暴露度 X,则本期因子 IC 值为(,),根据引理,因子 IC 值的平方就等于单因子测试的回归模型的2。所以,因子 IC 值本质上反映的是下期收益率和本期因子暴露度的线性相关程度(2的平方根),是使用该因子预测收益率的稳健性(IC 值越大,这个因子的收益越稳定,波动越小);而回归法中计算出的因子收益率本质上是一个斜率,反映的是从该因子可能获得的收益率的大小,这并不能说明任何关于线性拟合优度的信息(也就是说,因子收益率很大时,也可能出现2很小的情形);至于回归法中计算出的 t 值,在一元线性回归中 t 值与2反映的信息一致(二者对应关系为,当2=0时 t 值也为 0,当2=1时 t 值为无穷大),但是由于我们所采用的回归模型包括了行业变量,所以 t 值仅代表被测因子对股票收益的解释能力(而不能代表模型的整体拟合优度)。实际计算过程中因子会进行一些预处理,回归方程也有可能引入其它风格变量使其表达形式更复杂,导致 IC 值和 t 值无法理论上互推,但前面所述结论的本质不变。总结一下,IC 值反映模型整体线性拟合优度,t 值反映被测单因子对模型的解释能力是否显著,因子收益率与前两者差别较大,它反映的是可能获得的收益率的大小,而对这个收益是否稳健未知。其次介绍一下回归法和分层测试法之间的关系。假设本期因子值与下期收益完全线性相关,满足=+。此时 IC 值绝对值为 1,回归法中的因子收益率为。并且假设本期因子值 X 服从0,1均匀分布,那么当按因子从小到大等分 N 层测试时,第 i 层组合的下期收益为(2 1)/2+,多空收益(第 N 层收益减去第 1 层收益)为(1)/,也即说明分层测试法中的多空收益与回归法中的因子收益率具有一定程度的等价关系。实际上因子 IC 值大部分在 0.1 附近波动,所以回归拟合的因子收益率与分层测试下的多空收益也未必完全一致。金工研究/深度研究|2018 年 12 月 14 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 11 宽基指数内单因子测试结果分析宽基指数内单因子测试结果分析 本章我们将展示图表 1 和图表 2 中的一致预期因子的单因子测试结果,并分别挑选出在沪深 300、中证 500、全 A 内表现较好的因子进行详细