温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
人工智能
系列
十一
基于
遗传
规划
因子
挖掘
20190610
证券
25
谨请参阅尾页重要声明及华泰证券股票和行业评级标准 1 证券研究报告证券研究报告金工研究/深度研究 2019年06月10日 林晓明林晓明 执业证书编号:S0570516010001 研究员 0755-82080134 陈烨陈烨 执业证书编号:S0570518080004 研究员 010-56793942 李子钰李子钰 0755-23987436 联系人 何康何康 021-28972039 联系人 1金工金工:华泰单因子测试之海量技术因子华泰单因子测试之海量技术因子2019.05 2 金工金工:“华泰周期轮动”基金组合改进版“华泰周期轮动”基金组合改进版2019.05 3金工金工:A 股市场低开现象研究股市场低开现象研究2019.05 基于遗传规划的选股因子挖掘基于遗传规划的选股因子挖掘 华泰人工智能系列之二十一本文通过原理分析和系统测试,介绍了遗传规划在选股因子挖掘中的应用本文通过原理分析和系统测试,介绍了遗传规划在选股因子挖掘中的应用 遗传规划是一种启发式的公式演化技术,通过模拟自然界中遗传进化的过程来逐渐生成契合特定目标的公式群体,适合进行特征工程。将遗传规划运用于选股因子挖掘时,可以充分利用计算机的强大算力,同时突破人类的思维局限,挖掘出某些隐藏的、难以通过人脑构建的因子。本文介绍了遗传规划应用的完整流程,对遗传规划程序包 gplearn 进行了深度定制改进。测试结果显示,遗传规划能从有限的量价数据中挖掘出具有增量信息的因子,为选股因子研究提供了一种新的思路。针对因子挖掘问题,本文对遗传规划程序包针对因子挖掘问题,本文对遗传规划程序包 gplearn 进行了深度定制改进进行了深度定制改进 本文在遗传规划的应用中做出了以下贡献:(1)应用成熟的 gplearn 项目,对 gplearn 的关键参数进行了详细说明。(2)扩充了 gplearn 中的函数集,添加了一批适合于构造选股因子的函数。(3)将单因子测试过程引入gplearn,可以对待挖掘因子进行传统风格因子中性化。(4)使用了 Python的并行运算技术,加快了因子矩阵的运算速度,缩短了因子挖掘时间。经过测试,遗传规划能从有限的量价数据中挖掘出具有增量信息的因子经过测试,遗传规划能从有限的量价数据中挖掘出具有增量信息的因子 在遗传规划框架中,我们设定预测目标为个股 20 个交易日后的收益率,初步挖掘出了 6 个选股因子。这些因子在剔除了行业、市值、过去 20 日收益率、过去 20 日平均换手率、过去 20 日波动率五个因子的影响后,依然具有较稳定的 RankIC。6 个因子都具有良好的可解释性,其中大部分因子的相关性不高,说明遗传规划能从有限的量价数据中挖掘出具有增量信息的因子。遗传规划是一套灵活的框架,或许能为选股因子研究提供更多的可能性遗传规划是一套灵活的框架,或许能为选股因子研究提供更多的可能性 本着“授人以鱼不如授人以渔”的想法,本文旨在为读者展示遗传规划在选股因子挖掘中的详细流程,流程中的各环节依然有较大的调整空间。在实际应用中,读者可以根据自己特定的数据源、股票池、调仓周期、函数集以及评价指标来构建遗传规划框架。作为一种“先有公式、后有逻辑”的因子研究方法,遗传规划或许能为选股因子研究提供更多的可能性。风险提示:通过遗传规划挖掘的选股因子是历史经验的总结,存在失效的可能。遗传规划所得因子可能过于复杂,可解释性降低,使用需谨慎。本文仅对因子在全部 A 股内的选股效果进行测试,测试结果不能直接推广到其它股票池内。相关研究相关研究 2 1 0 6 2 9 3 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:2 1 金工研究/深度研究|2019 年 06 月 10 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 2 正文目录正文目录 本文研究导读.4 遗传规划简介.5 遗传规划的总体流程.5 遗传规划中公式的表示方式.5 遗传规划中的适应度.6 遗传规划中公式的进化方法.6 交叉.6 子树变异.7 点变异.7 Hoist 变异.7 gplearn 的简介和改进.8 gplearn 的简介和关键参数说明.8 gplearn 的改进.8 遗传规划选股因子挖掘的测试流程.10 遗传规划的主要参数设置和测试结果.11 遗传规划所得因子的单因子测试.12 单因子测试方法简介.12 回归法.12 IC 值分析法.13 分层回测法.13 遗传规划所得因子的回归测试、IC 测试结果汇总.14 Alpha1 因子的详细测试结果.15 Alpha2 因子的详细测试结果.16 Alpha3 因子的详细测试结果.17 Alpha4 因子的详细测试结果.18 Alpha5 因子的详细测试结果.19 Alpha6 因子的详细测试结果.20 因子的 IC 衰减测试.21 因子之间的相关性.21 总结与思考.23 风险提示.24 2 1 0 6 2 9 3 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:2 1 金工研究/深度研究|2019 年 06 月 10 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 3 图表目录图表目录 图表 1:遗传规划的总体流程.5 图表 2:公式树.6 图表 3:交叉.6 图表 4:子树变异.7 图表 5:点变异.7 图表 6:Hoist 变异.7 图表 7:gplearn 的主要参数.8 图表 8:函数列表.9 图表 9:原始因子列表.10 图表 10:遗传规划的主要参数设置.11 图表 11:遗传规划测试过程的统计信息.11 图表 12:遗传规划挖掘出的选股因子.11 图表 13:遗传规划所得因子的回归测试、IC 测试结果汇总.14 图表 14:Alpha1 的分层测试表现(因子做行业+4 个常见风格中性).15 图表 15:Alpha1 分层组合 110 净值除以基准净值.15 图表 16:Alpha1 累积 RankIC 和累积因子收益率.15 图表 17:Alpha2 的分层测试表现(因子做行业+4 个常见风格中性).16 图表 18:Alpha2 分层组合 110 净值除以基准净值.16 图表 19:Alpha2 累积 RankIC 和累积因子收益率.16 图表 20:Alpha3 的分层测试表现(因子做行业+4 个常见风格中性).17 图表 21:Alpha3 分层组合 110 净值除以基准净值.17 图表 22:Alpha3 累积 RankIC 和累积因子收益率.17 图表 23:Alpha4 的分层测试表现(因子做行业+4 个常见风格中性).18 图表 24:Alpha4 分层组合 110 净值除以基准净值.18 图表 25:Alpha4 累积 RankIC 和累积因子收益率.18 图表 26:Alpha5 的分层测试表现(因子做行业+4 个常见风格中性).19 图表 27:Alpha5 分层组合 110 净值除以基准净值.19 图表 28:Alpha5 累积 RankIC 和累积因子收益率.19 图表 29:Alpha6 的分层测试表现(因子做行业+4 个常见风格中性).20 图表 30:Alpha6 分层组合 110 净值除以基准净值.20 图表 31:Alpha6 累积 RankIC 和累积因子收益率.20 图表 32:因子 Alpha16 与对照因子的 Rank IC 衰减图(因子不中性化).21 图表 33:因子 Alpha16 与对照因子的 Rank IC 半衰期(因子不中性化).21 图表 34:因子 Alpha16 两两之间相关系数均值.22 2 1 0 6 2 9 3 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:2 1 金工研究/深度研究|2019 年 06 月 10 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 4 本文研究导读本文研究导读 在华泰金工人工智能系列前期的报告中,我们重点研究人工智能算法在多因子选股中因子合成方面的应用。本文则从一个新的角度出发,探索如何使用人工智能算法进行选股因子挖掘。在众多人工智能算法中,遗传规划(genetic programming)借鉴了生物进化的过程,是一种适合进行特征工程的算法。本文将详细讨论如何在股票量价数据中使用遗传规划进行选股因子挖掘。本文将主要关注以下三个问题:1.遗传规划的基本原理是什么?有哪些重要的参数?2.在将遗传规划运用于选股因子挖掘时,需要进行哪些定制化改进?3.遗传规划所得选股因子的表现如何?因子的含义如何解读?2 1 0 6 2 9 3 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:2 1 金工研究/深度研究|2019 年 06 月 10 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 5 遗传规划遗传规划简介简介 物竞天择,适者生存。天演论 遗传规划(genetic programming)是演化算法(evolutionary algorithm)的分支,是一种启发式的公式演化技术。遗传规划从随机生成的公式群体开始,通过模拟自然界中遗传进化的过程,来逐渐生成契合特定目标的公式群体。作为一种监督学习方法,遗传规划可以根据特定目标,发现某些隐藏的、难以通过人脑构建出的数学公式。传统的监督学习算法主要运用于特征与标签之间关系的拟合,而遗传规划则更多运用于特征挖掘(特征工程)。在量化多因子选股领域中,选股因子的挖掘是一个关注度经久不衰的主题。以往的因子研究中,人们一般从市场可见的规律和投资经验入手,进行因子挖掘和改进,即“先有逻辑、后有公式”的方法,常见的因子如估值、成长、财务质量、波动率等都是通过这种方法研究得出的。随着市场可用数据的增多和机器学习等先进技术的发展,我们可以借助遗传规划的方法在海量数据中进行探索,通过“进化”的方式得出一些经过检验有效的选股因子,再试图去解释这些因子的内涵,即“先有公式、后有逻辑”的方法。以上两种方式对应于选股因子研究方法中的“演绎法”与“归纳法”,都有一定的存在基础。而后者的优势在于可以充分利用计算机的强大算力进行启发式搜索,同时突破人类的思维局限,挖掘出某些隐藏的、难以通过人脑构建的因子,为因子研究提供更多的可能性。遗传规划的总体流程遗传规划的总体流程 图表 1 展示了遗传规划的总体流程。一开始,一组未经选择和进化的原始公式会被随机生成(第一代公式),通过某种规则计算每个公式的适应度,从中选出适合的个体作为下一代进化的父代。这些被选择出来的父代通过多种方法进化,形成不同的后代公式,然后循环进行下一轮进化。随着迭代次数的增长,公式不断繁殖、变异、进化,从而不断逼近数据分布的真相。图表图表1:遗传规划的总体流程遗传规划的总体流程 资料来源:华泰证券研究所 遗传规划中公式的表示方式遗传规划中公式的表示方式 为了方便进行公式的进化,遗传规划中的公式一般会被表示成二叉树的形式。假设有特征X0和 X1,需要预测目标 y。一个可能的公式是:=02 3 1+0.5 在遗传规划中上式用 S-表达式(S-expression)表示:=(+(00)(31)0.5)2 1 0 6 2 9 3 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:2 1 金工研究/深度研究|2019 年 06 月 10 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 6 公式里包括了变量(X0和 X1)、函数(加、减、乘)和常数(3 和 0.5)。我们可以把公式表示为一个二叉树,如图表 2 所示:图表图表2:公式树公式树 资料来源:gplearn,华泰证券研究所 在这个二叉树里,所有的叶子都是变量或者常数,内部节点则是函数。树内的任意子树都可以被修改或替代。公式的输出值可以用递归的方法求得。遗传规划中的遗传规划中的适应度适应度 类比于自然界中个体对其生存环境的适应程度,在遗传规划中,每个公式也有自己的适应度,适应度衡量了公式运算结果与给定目标的相符程度,是公式进化的重要参考指标。在不同的应用中,可以定义不同的适应度,例如对于回归问题,可以使用公式结果和目标值之间的均方误差为适应度,对于分类问题,可以使用公式结果和目标值之间的交叉熵为适应度。对于使用遗传规划生成的选股因子来说,可以使用因子在回测区间内的平均 RankIC或因子收益率来作为适应度。遗传规划中公式的进化方法遗传规划中公式的进化方法 遗传规划的核心步骤是公式的进化,算法会参照生物进化的原理,使用多种方式对公式群体进行进化,来生成多样性的、更具适应性的下一代公式群体。本节将依次介绍这些进化方法。交叉交叉 交叉是在两个已有公式树之间生成子树的方法,是最常用也最有效的进化方式。交叉需要通过两次选取找到父代和捐赠者,如图表 3 所示,首先选取适应度最高的公式树 A 作为父代,从中随机选择子树 A1进行替换;然后在剩余公式树中找到适应度最高的公式树 B 作为捐赠者,从中随机选择子树 B1,并将其插入到公式树 A 中替换 A1以形成后代。图表图表3:交叉交叉 资料来源:gplearn,华泰证券研究所 2 1 0 6 2 9 3 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:2 1 金工研究/深度研究|2019 年 06 月 10 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 7 子树变异子树变异 子树变异是一种激进的变异操作,父代公式树的子树可以被完全随机生成的子树所取代。这可以将已被淘汰的公式重新引入公式种群,以维持公式多样性。如图表 4 所示,子树变异选择适应度最高的公式树 A 作为父代,从中随机选择子树 A1进行替换,然后随机生成用以替代的子树 B,并将其插入到公式树 A 中以形成后代。图表图表4:子树变异子树变异 资料来源:gplearn,华泰证券研究所 点变异点变异 点变异是另一种常见的变异形式。与子树变异一样,它也可以将已淘汰的公式重新引入种群中以维持公式多样性。如图表 5 所示,点变异选取适应度高的父代公式树 A,并从中随机选择节点和叶子进行替换。叶子 A2被其他叶子替换,并且某一节点 A1上的公式被与其含有相同参数个数的公式所替换,以此形成后代。图表图表5:点变异点变异 资料来源:gplearn,华泰证券研究所 Hoist 变异变异 Hoist(提升)变异是一种对抗公式树过于复杂的方法。这种变异的目的是从公式树中移除部分叶子或者节点,以精简公式树。如图表 6 所示,Hoist 变异选取适应度高的父代公式树A 并从中随机选择子树 A1。然后从该子树中随机选取子树 A11,并将其“提升”到原来子树 A1的位置,以此形成后代。图表图表6:Hoist 变异变异 资料来源:gplearn,华泰证券研究所 2 1 0 6 2 9 3 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:2 1 金工研究/深度研究|2019 年 06 月 10 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 8 gplearn 的的简介简介和改进和改进 gplearn 的简介和关键参数说明的简介和关键参数说明 gplearn(https:/gplearn.readthedocs.io)是目前最成熟的 Python 遗传规划项目之一。gplearn 提供类似于 scikit-learn 的调用方式,并通过设置多个参数来完成特定功能。图表7 展示了 gplearn 的主要参数。图表图表7:gplearn 的主要参数的主要参数 参数名称参数名称 定义定义 generations 公式进化的世代数量。population_size 每一代公式群体中的公式数量。n_components 最终筛选出的最优公式数量。hall_of_fame 选定最后的 n_components 个公式前,提前筛选出的备选公式的数量,n_components hall_of_fame 2 占比占比 t 均值均值 因子收益因子收益率均值率均值 RankIC 均值均值 RankIC 标准差标准差 IC_IR IC0 占比占比 因子不做中性化处理因子不做中性化处理 Alpha1 2.40 45.85%1.55 0.39%5.04%7.73%0.65 79.08%Alpha2 3.19 60.02%1.02 0.28%2.39%10.90%0.22 59.18%Alpha3 5.26 76.48%2.88 0.72%9.07%15.99%0.57 73.08%Alpha4 4.72 71.89%2.92 0.62%9.17%12.91%0.71 77.36%Alpha5 4.94 72.29%2.93 0.62%9.25%14.32%0.65 75.38%Alpha6 3.30 57.06%1.36 0.37%3.05%11.49%0.27 59.09%因子仅做行业中性因子仅做行业中性 Alpha1 2.57 51.59%1.87 0.37%4.79%5.95%0.81 83.27%Alpha2 3.30 60.64%1.19 0.25%2.15%8.83%0.24 59.71%Alpha3 5.37 79.13%3.49 0.73%8.47%11.41%0.74 77.80%Alpha4 4.95 76.17%3.52 0.68%9.06%9.52%0.95 83.76%Alpha5 5.14 75.77%3.56 0.69%9.06%10.55%0.86 80.98%Alpha6 3.53 60.59%1.97 0.41%3.36%9.05%0.37 63.42%因子做行业因子做行业+市值中性市值中性 Alpha1 2.48 50.00%1.95 0.38%4.88%5.26%0.93 85.88%Alpha2 3.07 57.28%1.13 0.23%1.99%8.13%0.24 58.87%Alpha3 4.43 74.14%2.87 0.61%6.36%9.42%0.67 76.39%Alpha4 4.91 75.02%3.31 0.62%8.41%9.61%0.88 80.98%Alpha5 5.14 76.26%3.31 0.62%8.30%10.69%0.78 77.93%Alpha6 3.41 60.24%2.17 0.46%3.81%7.93%0.48 68.49%因子做行业因子做行业+4 个常见风格中性个常见风格中性 Alpha1 1.94 40.20%1.50 0.31%3.83%4.06%0.94 84.55%Alpha2 2.31 48.23%1.70 0.36%3.95%5.05%0.78 77.89%Alpha3 4.41 72.15%1.94 0.46%3.67%10.26%0.36 62.97%Alpha4 2.26 47.75%1.33 0.34%3.41%5.83%0.59 73.48%Alpha5 2.46 51.50%1.28 0.33%2.94%6.10%0.48 70.61%Alpha6 2.44 50.97%1.43 0.34%2.45%5.30%0.46 68.09%资料来源:Wind,华泰证券研究所 接下来,我们将详细展示以上 6 个因子在进行了行业+4 个常见风格中性后的测试结果。2 1 0 6 2 9 3 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:2 1 金工研究/深度研究|2019 年 06 月 10 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 15 Alpha1 因子的详细测试结果因子的详细测试结果 Alpha1=correlation(div(vwap,high),high,10)Alpha1 计算的是个股的 div(vwap,high)和 high 之间在 10 个交易日内的相关系数。从分层测试上看,Alpha1 的第 1 层表现欠佳,第 2 层表现最好。第 2 层到第 10 层的表现呈单调变化。从回归和 IC 测试上来看,Alpha1 具有较稳定的因子收益率和 RankIC,IC_IR 为0.94。图表图表14:Alpha1 的分层测试表现的分层测试表现(因子做行业因子做行业+4 个常见风格中性个常见风格中性)年化收益率年化收益率 年化波动率年化波动率 夏普比率夏普比率 最大回撤最大回撤 月均双边换手率月均双边换手率 年化超额收益率年化超额收益率 年化跟踪误差年化跟踪误差 信息比率信息比率 超额收益超额收益最大回撤最大回撤 超额收益超额收益Calmar 比率比率 相对基准相对基准月度胜率月度胜率 第第 1 层层 5.13%26.94%0.19 66.11%162.59%-1.32%1.86%-0.71 13.27%-0.10 46.90%第第 2 层层 7.77%27.29%0.28 60.75%164.16%1.27%1.26%1.01 2.82%0.45 60.18%第第 3 层层 7.54%27.34%0.28 60.94%164.82%1.07%1.03%1.04 1.74%0.62 61.06%第第 4 层层 6.68%27.50%0.24 61.68%164.93%0.30%0.96%0.31 3.27%0.09 48.67%第第 5 层层 6.00%27.45%0.22 62.45%164.77%-0.35%0.93%-0.38 5.95%-0.06 43.36%第第 6 层层 4.69%27.34%0.17 63.73%164.57%-1.61%0.92%-1.75 13.97%-0.12 29.20%第第 7 层层 3.36%27.41%0.12 65.77%164.38%-2.84%0.96%-2.97 24.29%-0.12 21.24%第第 8 层层 1.45%27.44%0.05 67.67%164.13%-4.63%1.00%-4.63 35.49%-0.13 7.96%第第 9 层层-1.02%27.16%-0.04 70.65%162.87%-7.03%1.21%-5.83 48.66%-0.14 3.54%第第 10 层层-5.36%26.69%-0.20 75.11%159.41%-11.23%1.96%-5.73 66.65%-0.17 6.19%基准基准 6.41%27.29%0.24 62.99%-多空组合多空组合 11.11%2.75%4.04 2.21%-资料来源:Wind,华泰证券研究所 图表图表15:Alpha1 分层组合分层组合 110 净值除以基准净值净值除以基准净值 图表图表16:Alpha1 累积累积 RankIC 和累积因子收益率和累积因子收益率 资料来源:Wind,华泰证券研究所 资料来源:Wind,华泰证券研究所 0.000.200.400.600.801.001.202010/012011/022012/032013/042014/052015/062016/072017/092018/10第1层第2层第3层第4层第5层第6层第7层第8层第9层第10层01234567801020304050607080901002010/012011/052012/092014/022015/062016/112018/03累积RankIC累积因子收益率累积RankIC累积因子收益率因子收益率均值:0.31%RankIC均值:3.83%IC_IR:0.942 1 0 6 2 9 3 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:2 1 金工研究/深度研究|2019 年 06 月 10 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 16 Alpha2 因子的详细测试结果因子的详细测试结果 Alpah2=ts_sum(rank(correlation(high,low,20),20)Alpah2 计算的是个股的 high 和 low 在 20 个交易日内相关系数的排序数之和。Alpah2 因子值越高的股票,其日最高价和最低价在走势上“步调”越一致。从分层测试上看,Alpha2的 110 层表现单调,但是前 3 层在最近几年的超额收益并不明显。从回归和 IC 测试上来看,Alpha2 的因子收益率和 RankIC 都比 Alpha1 高,但稳定性略差,IC_IR 为 0.78。图表图表17:Alpha2 的分层测试表现的分层测试表现(因子做行业因子做行业+4 个常见风格中性个常见风格中性)年化收益率年化收益率 年化波动率年化波动率 夏普比率夏普比率 最大回撤最大回撤 月均双边换手率月均双边换手率 年化超额收益率年化超额收益率 年化跟踪误差年化跟踪误差 信息比率信息比率 超额收益超额收益最大回撤最大回撤 超额收益超额收益Calmar 比率比率 相对基准相对基准月度胜率月度胜率 第第 1 层层 7.96%27.78%0.29 61.94%155.90%1.54%2.62%0.59 4.74%0.32 57.52%第第 2 层层 7.31%28.17%0.26 60.76%161.70%1.04%2.16%0.48 10.63%0.10 51.33%第第 3 层层 6.95%28.02%0.25 61.28%163.78%0.67%1.78%0.38 6.62%0.10 50.44%第第 4 层层 5.54%27.60%0.20 62.44%163.91%-0.76%1.35%-0.56 8.23%-0.09 35.40%第第 5 层层 5.14%27.60%0.19 63.14%164.93%-1.14%1.28%-0.89 10.92%-0.10 32.74%第第 6 层层 3.91%27.36%0.14 65.03%165.02%-2.36%1.23%-1.92 20.06%-0.12 30.97%第第 7 层层 2.98%27.14%0.11 66.04%164.07%-3.30%1.37%-2.41 27.27%-0.12 25.66%第第 8 层层 1.42%26.75%0.05 68.23%161.60%-4.86%1.67%-2.91 37.40%-0.13 23.01%第第 9 层层-0.32%26.37%-0.01 70.83%159.65%-6.60%2.08%-3.17 47.91%-0.14 20.35%第第 10 层层-3.92%25.97%-0.15 74.09%148.70%-10.08%2.83%-3.56 62.67%-0.16 15.93%基准基准 6.41%27.28%0.23 62.99%-多空组合多空组合 12.81%4.38%2.92 4.16%-资料来源:Wind,华泰证券研究所 图表图表18:Alpha2 分层组合分层组合 110 净值除以基准净值净值除以基准净值 图表图表19:Alpha2 累积累积 RankIC 和累积因子收益率和累积因子收益率 资料来源:Wind,华泰证券研究所 资料来源:Wind,华泰证券研究所 0.000.200.400.600.801.001.202010/012011/022012/032013/042014/052015/062016/072017/092018/10第1层第2层第3层第4层第5层第6层第7层第8层第9层第10层-10123456789-1001020304050607080901002010/012011/052012/092014/022015/062016/112018/03累积RankIC累积因子收益率累积RankIC累积因子收益率因子收益率均值:0.36%RankIC均值:3.95%IC_IR:0.782 1 0 6 2 9 3 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:2 1 金工研究/深度研究|2019 年 06 月 10 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 17 Alpha3 因子的详细测试结果因子的详细测试结果 Alpha3=-ts_stddev(volume,5)Alpha3 的意义非常简明,其描述的是个股成交量近 5 日的波动率。从分层测试上来看,Alpha3 呈现出“中间好,两头差”的情况,也就是说,成交量 5 日波动率偏低或偏高的股票组合表现不如成交量 5 日波动率中等的股票组合。Alpha3 的因子收益率和 RankIC 都不太稳定,IC_IR 为 0.36。图表图表20:Alpha3 的分层测试表现的分层测试表现(因子做行业因子做行业+4 个常见风格中性个常见风格中性)年化收益率年化收益率 年化波动率年化波动率 夏普比率夏普比率 最大回撤最大回撤 月均双边换手率月均双边换手率 年化超额收益率年化超额收益率 年化跟踪误差年化跟踪误差 信息比率信息比率 超额收益超额收益最大回撤最大回撤 超额收益超额收益Calmar 比率比率 相对基准相对基准月度胜率月度胜率 第第 1 层层 3.45%26.76%0.13 60.74%107.03%-3.05%5.08%-0.60 29.78%-0.10 48.67%第第 2 层层 6.23%27.43%0.23 60.20%145.20%-0.18%3.32%-0.05 10.88%-0.02 50.44%第第 3 层层 7.95%27.57%0.29 59.36%153.17%1.50%2.50%0.60 5.77%0.26 56.64%第第 4 层层 8.76%27.60%0.32 60.08%155.49%2.28%2.10%1.09 5.53%0.41 61.06%第第 5 层层 9.41%27.62%0.34 60.69%155.75%2.90%1.96%1.48 5.13%0.57 59.29%第第 6 层层 8.95%27.35%0.33 61.35%154.06%2.40%1.82%1.32 5.78%0.41 59.29%第第 7 层层 6.66%27.23%0.24 64.12%152.01%0.21%1.91%0.11 6.83%0.03 49.56%第第 8 层层 1.28%27.08%0.05 69.17%151.08%-4.90%2.71%-1.81 38.43%-0.13 33.63%第第 9 层层-4.51%27.55%-0.16 73.27%140.26%-10.28%4.29%-2.40 62.92%-0.16 26.55%第第 10 层层-8.10%27.76%-0.29 78.79%125.73%-13.58%3.81%-3.57 74.09%-0.18 20.35%基准基准 6.41%27.28%0.23 62.99%-多空组合多空组合 11.89%7.96%1.49 15.77%-资料来源:Wind,华泰证券研究所 图表图表21:Alpha3 分层组合分层组合 110 净值除以基准净值净值除以基准净值 图表图表22:Alpha3 累积累积 RankIC 和累积因子收益率和累积因子收益率 资料来源:Wind,华泰证券研究所 资料来源:Wind,华泰证券研究所 0.000.200.400.600.801.001.201.402010/012011/022012/032013/042014/052015/062016/072017/092018/10第1层第2层第3层第4层第5层第6层第7层第8层第9层第10层-2024681012-1001020304050607080902010/012011/052012/092014/022015/062016/112018/03累积RankIC累积因子收益率累积RankIC累积因子收益率因子收益率均值:0.46%RankIC均值:3.67%IC_IR:0.362 1 0 6 2 9 3 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:2 1 金工研究/深度研究|2019 年 06 月 10 日 谨请参阅尾页重要声明及华泰证券股票和行业评级标准 18 Alpha4 因子的详细测试结果因子的详细测试结果 Alpha4=-mul(rank(covariance(high,volume,10),rank(ts_stddev(high,10)Alpha4 因子由两部分相乘而得,左边部分 rank(covariance(high,volume,10)衡量个股的10 日量价同步程度,右边部分 rank(ts_stddev(high,10)衡量个股的 10 日最高价波动率。从分层测试上来看,Alpha4 第 1 层和第 2 层表现欠佳,第 4第 10 层表现单调。Alpha4的因子收益率和 RankIC 较为稳定,IC_IR 为 0.59。图表图表23:Alpha4 的分层测试表现的分层测试表现(因子做行业因子做行业+4 个常见风格中性个常见风格中性)年化收益率年化收益率 年化波动率年化波动率 夏普比率夏普比率 最大回撤最大回撤 月均双边换手率月均双边换手率 年化超额收益率年化超额收益率 年化跟踪误差年化跟踪误差 信息比率信息比率 超额收益超额收益最大回撤最大回撤 超额收益超额收益Calmar 比率比率 相对基准相对基准月度胜率月度胜率 第第 1 层层 3.98%27.84%0.14 66.85%149.52%-2.19%3.44%-0.64 19.09%-0.11 44.25%第第 2 层层 6.51%26.69%0.24 63.05%156.58%-0.08%1.95%-0.04 5.26%-0.02 46.90%第第 3 层层 8.06%26.41%0.31 60.45%157.39%1.28%2.54%0.50 5.80%0.22 52.21%第第 4 层层 8.73%26.46%0.33 59.83%158.11%1.92%2.64%0.73 5.32%0.36 56.64%第第 5 层层 8.13%26.43%0.31 60.54%158.75%1.36%2.48%0.55 5.67%0.24 49.56%第第 6 层层 6.52%26.77%0.24 62.86%160.39%-0.05%1.73%-0.03 5.85%-0.01 48.67%第第 7 层层 3.57%27.41%0.13 66.39%161.86%-2.64%1.11%-2.38 22.65%-0.12 22.12%第第 8 层层 0.13%28.32%0.00 70.00%162.09%-5.65%2.03%-2.78 41.69%-0.14 21.24%第第 9 层层-2.95%28.73%-0.10 71.72%158.77%-8.47%3.11%-2.72 55.91%-0.15 24.78%第第 10 层层-5.81%28.31%-0.21 73.16%146.72%-11.29%3.66%-3.08 66.62%-0.17 25.66%基准基准 6.41%27.28%0.23 62.99%-多空组合多空组合 10.18%3.46%2.94 4.23%-资料来源:Wind,华泰证券研究所 图表图表24:Alpha4 分层组合分层组合 110 净值除以基准净值净值除以基准净值 图表图表25:Alpha4 累积累积 RankIC 和累积因子收益率和累积因子收益率 资料来源:Wind,华泰证券研究所 资料来源:Wind,华泰证券研究所 0.000.200.400.600.801.001.201.402010/012011/022012/032013/042014/052015/062016/072017/092018/10第1层第2层第3层第4层第5层第6层第7层第8层第9层第10层012345678010203040506070802010/012011/052012/092014/022015/062016/112018/03累积RankIC累积因子收益率累积RankIC累积因子收益率因子收益率均值:0.34%RankIC均值:3.41%IC_IR:0.592 1 0 6 2 9 3 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:2 1 金工研究/深度研究|2019 年 0