分享
渤海证券_20180710_行业轮动专题一:使用随机森林算法的行业轮动模型.pdf
下载文档

ID:3047505

大小:1.09MB

页数:20页

格式:PDF

时间:2024-01-18

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
渤海 证券 _20180710_ 行业 专题 使用 随机 森林 算法 模型
权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 1 of 19 金金融融工工程程研研究究 证证券券研研究究报报告告 权权益益 专专题题 报报告告 证券分析师证券分析师 宋旸 022-28451131 18222076300 相关研究报告相关研究报告 多因子模型研究之一:单因子测试20171011 多因子模型研究之二:收益预测模型20171229 多因子模型研究之三:风险 模 型 与 组 合 优 化 20180416 核心观点:核心观点:1 1、长久以来,选股与择时都是量化金融领域面对的两个最主要的问题。多长久以来,选股与择时都是量化金融领域面对的两个最主要的问题。多因子模型是在量化选股中最常用的模型,在之前的报告中,我们详细介因子模型是在量化选股中最常用的模型,在之前的报告中,我们详细介绍了这一模型。然而绍了这一模型。然而 20172017 年以来,市场分化逐渐显著,靠选股获得年以来,市场分化逐渐显著,靠选股获得 alphaalpha收益的难度越来越大。这时,我们就需要依靠择时模型来减小规避系统收益的难度越来越大。这时,我们就需要依靠择时模型来减小规避系统性风险,减小策略回撤。性风险,减小策略回撤。2 2、随机森林算法是一种机器学习分类算法。它通过训练样本生成大量决策随机森林算法是一种机器学习分类算法。它通过训练样本生成大量决策树,综合所有决策树的分类结果得到最终决策。相比于其他机器学习算树,综合所有决策树的分类结果得到最终决策。相比于其他机器学习算法和传统线性回归模型,随机森林算法具有直观,参数少,抗干扰,不法和传统线性回归模型,随机森林算法具有直观,参数少,抗干扰,不易出现过拟合等优点。将随机森林算法引入择时模易出现过拟合等优点。将随机森林算法引入择时模型,可以减少主观判型,可以减少主观判断对于择时结果的影响,挖掘市场更深层次的运行规律。断对于择时结果的影响,挖掘市场更深层次的运行规律。3 3、将将 2828 个申万行业指数作为择时标的,提取个申万行业指数作为择时标的,提取 4141 个有效因子,以个有效因子,以 20102010-20162016年数据为样本集,年数据为样本集,20172017 年年-20182018 年数据组为验证集,建立择时模型。模年数据组为验证集,建立择时模型。模型平均准确率型平均准确率 54.48%54.48%,20172017 年至今平均超额收益年至今平均超额收益 15.03%15.03%,平均择时净,平均择时净值值 1.071.07,平均减少最大回撤,平均减少最大回撤 11.73%11.73%。在。在 2828 个行业中,有个行业中,有 2525 个行业的择个行业的择时结果强于指数,取得超额收益的概率高达时结果强于指数,取得超额收益的概率高达 89%89%。20172017 年至今,市场呈年至今,市场呈现较为明显的分化局势,仅现较为明显的分化局势,仅 7 7 个行业收益为正,个行业收益为正,2121 个行业都有不同程度个行业都有不同程度下跌。择时后,收下跌。择时后,收益为正的行业增加至益为正的行业增加至 2020 个,且剩余个,且剩余 8 8 个收益为负的行个收益为负的行业净值相比不择时的情况都有了大幅提升。业净值相比不择时的情况都有了大幅提升。4 4、根据择时结果,可建立行业轮动模型,每周调仓。在大部分行业普遍回根据择时结果,可建立行业轮动模型,每周调仓。在大部分行业普遍回调的情况下,模型依然取得了正收益。最终轮动模型年化收益调的情况下,模型依然取得了正收益。最终轮动模型年化收益 4.4%4.4%,超,超出上证综指出上证综指 5.7%5.7%;最大回撤;最大回撤 10.7%10.7%,小于上证综指的,小于上证综指的 14.6%14.6%。5 5、在未来,我们还计划陆续推出行业内的多因子选股模型。该模型和行业在未来,我们还计划陆续推出行业内的多因子选股模型。该模型和行业内选股模型相结合,可以达到自上而下择时选股一体的优化结果,得到内选股模型相结合,可以达到自上而下择时选股一体的优化结果,得到更灵活、更细致、更有针对性的量化模型。更灵活、更细致、更有针对性的量化模型。6 6、风险提示:随着市场环境变化,模型存在失效风险。风险提示:随着市场环境变化,模型存在失效风险。使用使用随机森随机森林算法的行业轮动模型林算法的行业轮动模型 行业轮动专题一行业轮动专题一 分析师:分析师:宋旸 SAC NO:S1150517100002 2018 年 7 月 10 日 权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 2 of 19 目目 录录 1概述.4 2随机森林算法理论介绍.4 2.1 决策树.4 2.2 集成方法.6 2.3 随机森林算法.6 3.行业轮动模型的建立与运行结果.7 3.1 因子提取.8 3.2 模型建立.9 3.3 择时结果.9 3.4 行业轮动模型.15 4总结与未来研究方向展望.15 权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 3 of 19 表目录 表表 1 1:因子列表与释义:因子列表与释义.8 表表 2 2:分行业择时结果:分行业择时结果.9 图目录 图图 1 1:决策树技术面择时示意图:决策树技术面择时示意图.5 图图 2 2:随机森林算法示意图:随机森林算法示意图.7 图图 3:3:农林牧渔行业择时结果农林牧渔行业择时结果.10 图图 4 4:采掘行业择时结果:采掘行业择时结果.10 图图 5:5:化工行业择时结果化工行业择时结果.11 图图 6 6:钢铁行业择时结果:钢铁行业择时结果.11 图图 7:7:有色金属行业择时结果有色金属行业择时结果.11 图图 8 8:电子行业择时结果:电子行业择时结果.11 图图 9:9:家用电器行业择时结果家用电器行业择时结果.11 图图 1010:食品饮料行业择时结果:食品饮料行业择时结果.11 图图 11:11:纺织服装行业择时结果纺织服装行业择时结果.12 图图 1212:轻工制造行业择时结果:轻工制造行业择时结果.12 图图 13:13:医药生物行业择医药生物行业择时结果时结果.12 图图 1414:公用事业行业择时结果:公用事业行业择时结果.12 图图 15:15:交通运输行业择时结果交通运输行业择时结果.12 图图 1616:房地产行业择时结果:房地产行业择时结果.12 图图 17:17:商业贸易行业择时结果商业贸易行业择时结果.13 图图 1818:休闲服务行业择时结果:休闲服务行业择时结果.13 图图 19:19:综合行业择时综合行业择时结果结果.13 图图 2020:建筑材料行业择时结果:建筑材料行业择时结果.13 图图 21:21:建筑装饰行业择时结果建筑装饰行业择时结果.13 图图 2222:电气设备行业择时结果:电气设备行业择时结果.13 图图 23:23:国防军工行业择时结果国防军工行业择时结果.14 图图 2424:计算机行业择时结果:计算机行业择时结果.14 图图 25:25:传媒行业择时结果传媒行业择时结果.14 图图 2626:通信行业择时结果:通信行业择时结果.14 图图 27:27:银行行业择时结果银行行业择时结果.14 图图 2828:非银金融行业择时结果:非银金融行业择时结果.14 图图 29:29:汽车行业择时结果汽车行业择时结果.15 图图 3030:机械设备行业择时结果:机械设备行业择时结果.15 图图 3131:行业轮动模型收益:行业轮动模型收益.15 权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 4 of 19 1 概述概述 长久以来,选股与择时都是股票量化领域面对的两个最主要的问题。多因子模型是在量化选股中最常用的模型,在之前的报告中,我们详细介绍了这一模型。然而 2017 年以来,市场分化逐渐显著,靠选股获得 alpha 收益的难度越来越大。这时,我们就需要依靠择时模型来规避系统性风险。有效的择时策略可以平滑收益曲线,减小策略回撤。相比与完全对冲策略而言,择时策略不需要承担高额的对冲成本,是性价比更高的选择。随机森林算法是一种机器学习分类算法。它通过训练样本生成大量决策树,综合所有决策树的分类结果得到最终决策。相比于其他机器学习算法和传统线性回归模型,随机森林算法具有直观,参数少,抗干扰,不易出现过拟合等优点。将随机森林算法引入择时模型,可以减少主观判断对于择时结果的影响,挖掘市场更深层次的运行规律。理论上讲,择时模型可以应用于任何股票,甚至其他种类的资产。但考虑到单支股票走势受较多突发新闻与人为因素影响,我们在这里选择使用 28 个申万行业指数作为择时标的,组成行业轮动模型。这样选择的另一个原因是,在未来,我们还计划陆续推出行业内的多因子选股模型。该模型和行业内选股模型相结合,可以达到自上而下择时选股一体的优化结果,得到更灵活、更细致、更有针对性的量化模型。2 2随机森林算法理论介绍随机森林算法理论介绍 2.1 2.1 决策树决策树 决策树方法最早产生于 20 世纪 60 年代,由 Hunt 等人提出。70 年代末,Quinlan提出 ID3 算法,引进信息论中的有关思想,提出用信息增益(information gain)作为特征判别能力的度量,并采用迭代算法进行建模。1984 年 Breiman 等人提出CART 算法,CART 是一种典型的二叉决策树算法,既可以做分类,也可以做回归,应用十分广泛。1993 年 Quinlan 以 ID3 算法为基础提出 C4.5 算法,新算法在缺失值处理、剪枝技术、派生规则等方面做了较大改进,C5.0 是 C4.5 的商业改进版。C5.0 和 CART 是目前较为广泛使用的决策树算法。决策树算法的构建核心是归纳算法。建模之初,全部数据组成一个节点,称为根节点,根据数据特征,选取最优的划分条件,将数据分成两个或多个纯度更大的 权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 5 of 19 数据子集,依次递推,直到满足预先设定的某个条件后停止。其最终结果看上去像一棵倒长的树,这也是算法名的来源。决策树的建立步骤如下:1)特征选择:从训练数据的特征中选择一个特征作为当前节点的分裂标准(特征选择的标准不同产生了不同的特征决策树算法)。2)决策树生成:根据所选特征评估标准,从上至下递归地生成子节点,直到数据集不可分则停止决策树停止生成。3)剪枝:决策树容易过拟合,需要剪枝来缩小树的结构和规模(包括预剪枝和后剪枝)。根据不同的算法,衡量节点不纯度的指标包括错分率、Gini 指数、熵(entropy)等等。同样是分类算法,与逻辑回归相比,决策树每次只对单一特征进行划分,拟合出来的函数为分区间的阶梯函数。这种算法更接近人的思维方式,模型具有更好的可解释性,且可以产生可视化的分类规则。决策树的这种算法构造,决定了它是一类很适合用于择时模型的算法。图图 1 1:决策树技术面择时示意图:决策树技术面择时示意图 权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 6 of 19 资料来源:Wind,渤海证券研究所 如图 1 所示,决策树算法通过考察不同技术因子的值,分部对下一阶段股票走势进行判断,也很类似于我们使用技术因子进行股票择时的思维步骤。决策树模型最大的问题是不稳定,容易过拟合。数据上微小的扰动都可能得到完全不同的分支结果,使模型的解释性产生问题。接下来介绍的随机森林方法,通过组合多棵决策树,可以显著降低方差,解决过拟合问题,是一种常用的集成方法(Ensemble method)。2.2 2.2 集成方法(集成方法(Ensemble methodEnsemble method)集成方法是一种增强预测性的统计学习算法。集成方法不是构造分类模型,而是用一定方式将多个模型组合起来,用以训练拟合数据。通过构造一系列分类器,通常是小型决策树,为预测进行加权投票,最后完成对于数据点的分类。集成学习方法主要分两类:bagging 和 boosting。Bagging 是 bootstrap aggregating 的缩写,它指的是利用 Bootstrap 抽样方法对训练集进行抽样,得到一系列新的训练集,对每个训练集构建一个预测器,称为基预测器(base predictor),组合所有预测器得到最终的预测模型,最终的预测模型是所有基预测器投票的结果。这种方法可以降低方差,同时避免过拟合。另一方面,boosting 方法则是以上一步模型的误分类为着重训练目标的集成方法。Boosting 从原始数据拟合的一个简单分类器开始。在拟合完成第一个模型之后,计算出分类错误,给数据重新分配权重,之前被错误分类的样本比正确分类的样本有更高的权重。观测值在每一步中不断的重新分配权重,上一个模型错误分类的观测获得更高的权重。最后的预测结果将由在迭代过程中生成的每一棵树投票,并由树的精确度计算权重得出。Boosting 的预测准确率可能会高于 bagging,但是它有可能会造成过拟合的后果。随机森林(random forest)算法在 2001 年由 Breiman 提出,与 bagging 算法类似,可以看成是 bagging 算法的一种变体。由于这种算法在训练、调参时简单有效,因此是目前相当流行的一种集成算法。2.3 2.3 随机森林算法随机森林算法 随机森林算法的基本步骤与 bagging 算法类似,首先建立若干决策树,建立每个 权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 7 of 19 决策树时,除了使用 bootstrap 方法随机选择测试样本之外,还会随机选择特征变量,这样,就可以降低树与树之间的相关系数。最后,依然是通过统计投票结果确定最后的分类信息。随机森林也是一种特定的集成方法,特别适合解决含有大量特征变量的问题。在其他模型中,一个特征变量的效果可能会被其他更显著的特征变量所掩盖。但随机森林在每棵决策树上使用随机选择的特征变量进行训练,这样可以更好地检测每个变量所产生的贡献和行为。相对于单棵决策树而言,随机森林在提高预测准确度和减小方差方面有了很大提升。随机森林算法的基本步骤如下:1.对于每棵树 ,1)从全部训练样本中,采用 Bootstrap 法抽取 n 个样本构成训练集 。2)基于训练集 构造决策树 ,对树上的每个节点,重复以下步骤,直到节点的样本数达到指定的最小限定值 :a)从全部 个随机变量中随机取 个,一般取 ;b)从 m 个随机变量中取最佳分枝变量;c)在这一节点上分裂成两个子节点。2.输出组合后的 K 棵树,取投票最多的预测为最终分类结果。图图 2 2:随机森林算法示意图:随机森林算法示意图 资料来源:Wind,渤海证券研究所 3.3.行业轮动模型的建立与运行结果行业轮动模型的建立与运行结果 权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 8 of 19 3.1 3.1 因子提取因子提取 在因子库选择上,我们侧重选择了变动较为剧烈的技术面因子,并在选择因子周期时参考技术分析理论中的常用参数。同时也一定程度上考虑了行业的估值因子(PB、PE),行业内部股票一致度因子(行业内上涨股票比例)与行业内前 3 名股票走势对指数未来走势的影响。加上不同时间段的影响(6 天、12 天、25 天 RSI 值算三个因子),模型共计参考因子 41 个。根据随机森林算法,默认单棵决策树参考因子为 个。表表1:因子列表与释义:因子列表与释义 因子名称因子名称 释义释义 RSI(6/12/25)6/12/25/天相对强弱指数 ROC(6/12)6/12 天股价变动率 PSY(6/12/25)6/12/25 天心理指数(N 日内上涨天数占比)PSYMA(6/12/25)VR(12/24)VRMA(12/24)6/12/25 天心理线指数 5 日移动平均 12/24 天成交量变异率 12/24 天成交量变异率 5 日移动平均 BIAS(5/10/20)5/10/20 天乖离率 K K 值,参数(9,3,3)D J K/D Slope(K/D)Slope(K/D,5)MOM(5/10/20/60)DIF DEA MACD Slope(MACD)Slope(MACD,5)AMT_relative(20/250)UP_ratio(1/5/20)D 值,参数(9,3,3)J 值 K-D K/D 曲线斜率 K/D 曲线 5 日斜率 5/10/20/60 日动量 DIF 值,参数(12,26,9)DEA 值,参数(12,26,9)MACD 值 MACD 曲线斜率 MACD 曲线 5 日斜率 今日成交量与 20/250 日平均成交量的比值 1/5/20 天行业内上涨股票比例 PE 行业 PE 均值 PB 行业 PB 均值 TOP3_CHANGE(5/20)TOP3_BENCHMARK(5/20)5/20 天行业内前 3 名股票涨跌幅 5/20 天行业内前 3 名股票相对行业指数涨跌幅 资料来源:Wind,渤海证券研究所 权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 9 of 19 3.2 3.2 模型建立模型建立 训练集:2010-2016 年 28 个申万行业指数因子日数据 验证集:2017 年-2018 年上半年 28 个申万行业指数因子日数据 模型建立方法:基于每个行业指数单独建立随机森林模型,X 为训练集数据,Y为未来 5 日指数涨跌(上涨、下跌两种情况)。将验证集数据带入训练后的模型中,进行择时。训练集数据使用 5 日滚动,这样保证了训练集的数据量。验证集数据每周判定一次。假设择时账户初始虚拟净值为 1,如在空仓情况下模型判定下周上涨,则在下周一使用开盘价将虚拟净值换为对应份数的指数;如在空仓情况下模型判定下周下跌,则不进行操作,净值不变。如在持仓情况下模型判定下周下跌,则在下周一卖出指数,账户虚拟净值变为前期持有指数的份数乘以指数开盘价;如在持仓情况下模型判定下周上涨,则继续持有指数。3.33.3 择时结果择时结果 通过随机森林算法对申万 28 个行业指数进行择时,模型平均准确率54.48%准确率 ,2017 年至今平均超额收益 15.03%,择时后指数平均净值 1.07,平均减少最大回撤 11.73%。在 28 个行业中,有 25 个行业的择时结果强于指数,取得超额收益概率高达 89%。2017 年至今,市场呈现较为明显的分化局势,仅 7 个行业收益为正,21 个行业都有不同程度下跌。择时后,收益为正的行业增加至 20 个,且剩余 8 个收益为负的行业净值相比不择时的情况都有了大幅提升。表表 2 2:分行业择时结果(:分行业择时结果(20172017-2018.62018.6)准确率准确率 择时净值择时净值 对应行业指对应行业指数净值数净值 超额收益超额收益 择时最大回择时最大回撤撤 行业指数最行业指数最大回撤大回撤 最大回撤减最大回撤减少少 农林牧渔农林牧渔 51.76%0.86 0.82 4.16%25.08%26.67%1.60%采掘采掘 55.88%0.92 0.82 10.14%25.65%30.05%4.40%化工化工 56.47%1.03 0.89 14.32%11.14%18.11%6.98%钢铁钢铁 50.29%1.15 1.02 13.01%16.44%26.84%10.41%有色金属有色金属 62.65%1.29 0.97 32.00%14.16%29.64%15.48%电子电子 48.53%1.05 0.97 7.67%16.72%28.49%11.77%家用电器家用电器 56.47%1.47 1.37 10.70%15.26%20.94%5.68%食品饮料食品饮料 47.06%1.34 1.62-27.33%6.91%18.27%11.36%纺织服装纺织服装 57.06%1.00 0.73 27.25%12.36%33.34%20.98%权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 10 of 19 轻工制造轻工制造 57.06%1.01 0.80 20.66%11.89%26.89%15.00%医药生物医药生物 58.82%1.30 1.17 12.87%7.21%15.48%8.27%公用事业公用事业 58.24%1.00 0.81 19.01%9.57%28.36%18.79%交通运输交通运输 47.94%1.01 0.97 4.25%10.57%15.79%5.22%房地产房地产 48.82%1.01 0.88 12.40%16.82%27.15%10.33%商业贸易商业贸易 62.94%1.20 0.84 35.40%10.43%26.85%16.42%休闲服务休闲服务 59.12%1.06 1.11-4.07%14.31%16.97%2.66%综合综合 53.24%0.77 0.61 15.32%30.28%43.04%12.76%建筑材料建筑材料 50.88%1.15 0.94 21.20%14.53%24.98%10.44%建筑装饰建筑装饰 50.88%0.97 0.79 18.04%16.51%33.98%17.47%电气设备电气设备 51.76%0.99 0.77 21.63%12.17%28.04%15.87%国防军工国防军工 47.35%0.80 0.68 12.77%31.26%43.47%12.20%计算机计算机 54.73%1.22 0.91 30.57%14.01%28.13%14.12%传媒传媒 60.88%0.88 0.68 20.68%21.57%36.52%14.95%通信通信 58.82%1.27 0.83 43.99%14.42%27.03%12.61%银行银行 57.35%1.14 1.05 8.78%7.03%21.84%14.81%非银金融非银金融 58.24%1.00 1.01-1.37%21.84%26.41%4.57%汽车汽车 50.00%1.06 0.86 19.27%8.87%22.79%13.92%机械设备机械设备 52.06%0.93 0.75 17.64%11.74%31.18%19.44%全体全体 54.48%1.07 0.92 15.03%15.31%27.04%11.73%资料来源:Wind,渤海证券研究所 下面展示 28 个行业 2017 年至今择时结果,黑线表示行业指数,红线表示择时后的指数。图图 3 3:农林牧渔行业择时结果农林牧渔行业择时结果(20172017-2018.62018.6)图图 4 4:采掘行业择时结果:采掘行业择时结果(20172017-2018.62018.6)数据来源:Wind、渤海证券研究所 数据来源:Wind、渤海证券研究所 权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 11 of 19 图图 5 5:化工行业择时结果化工行业择时结果(20172017-2018.62018.6)图图 6 6:钢铁行业择时结果(:钢铁行业择时结果(20172017-2018.62018.6)数据来源:Wind、渤海证券研究所 数据来源:Wind、渤海证券研究所 图图 7 7:有色金属行业择时结果有色金属行业择时结果(20172017-2018.62018.6)图图 8 8:电子行业择时结果:电子行业择时结果(20172017-2018.62018.6)数据来源:Wind、渤海证券研究所 数据来源:Wind、渤海证券研究所 图图 9 9:家用电器行业择时结果家用电器行业择时结果(20172017-2018.62018.6)图图 1010:食品饮料行业择时结果食品饮料行业择时结果(20172017-2018.62018.6)数据来源:Wind、渤海证券研究所 数据来源:Wind、渤海证券研究所 权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 12 of 19 图图 1111:纺织服装行业择时结果纺织服装行业择时结果(20172017-2018.62018.6)图图 1212:轻工制造行业择时结果轻工制造行业择时结果(20172017-2018.62018.6)数据来源:Wind、渤海证券研究所 数据来源:Wind、渤海证券研究所 图图 1313:医药生物行业择时结果(医药生物行业择时结果(20172017-2018.62018.6)图图 1414:公用事业行业择时结果(:公用事业行业择时结果(20172017-2018.62018.6)数据来源:Wind、渤海证券研究所 数据来源:Wind、渤海证券研究所 图图 1515:交通运输行业择时结果(交通运输行业择时结果(20172017-2018.62018.6)图图 1616:房地产行业择时结果(:房地产行业择时结果(20172017-2018.62018.6)数据来源:Wind、渤海证券研究所 数据来源:Wind、渤海证券研究所 权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 13 of 19 图图 1717:商业贸易行业择时结果(商业贸易行业择时结果(20172017-2018.62018.6)图图 1818:休闲服务行业择时结果(:休闲服务行业择时结果(20172017-2018.62018.6)数据来源:Wind、渤海证券研究所 数据来源:Wind、渤海证券研究所 图图 1919:综合行业择时结果(综合行业择时结果(20172017-2018.62018.6)图图 2020:建筑材料行业择时结果(:建筑材料行业择时结果(20172017-2018.62018.6)数据来源:Wind、渤海证券研究所 数据来源:Wind、渤海证券研究所 图图 2121:建筑装饰行业择时结果(建筑装饰行业择时结果(20172017-2018.62018.6)图图 2222:电气设备行业择时结果(:电气设备行业择时结果(20172017-2018.62018.6)数据来源:Wind、渤海证券研究所 数据来源:Wind、渤海证券研究所 权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 14 of 19 图图 2323:国防军工行业择时结果(国防军工行业择时结果(20172017-2018.62018.6)图图 2424:计算机行业择时结果(:计算机行业择时结果(20172017-2018.62018.6)数据来源:Wind、渤海证券研究所 数据来源:Wind、渤海证券研究所 图图 2525:传媒行业择时结果(传媒行业择时结果(20172017-2018.62018.6)图图 2626:通信行业择时结果(:通信行业择时结果(20172017-2018.62018.6)数据来源:Wind、渤海证券研究所 数据来源:Wind、渤海证券研究所 图图 2727:银行行业择时结果(银行行业择时结果(20172017-2018.62018.6)图图 2828:非银金融行业择时结果(:非银金融行业择时结果(20172017-2018.62018.6)数据来源:Wind、渤海证券研究所 数据来源:Wind、渤海证券研究所 权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 15 of 19 图图 2929:汽车行业择时结果汽车行业择时结果(20172017-2018.62018.6)图图 3030:机械设备行业择时结果(:机械设备行业择时结果(20172017-2018.62018.6)数据来源:Wind、渤海证券研究所 数据来源:Wind、渤海证券研究所 3.43.4 行业轮动模型行业轮动模型 根据择时结果,可建立行业轮动模型。每周根据模型预测,选择上涨概率最高的5 个行业(如上涨概率0.5 的行业不足 5 个,则仅选择上涨概率0.5 的行业,不足部分按空仓处理),每周调仓。在近期大部分行业普遍回调的情况下,模型依然取得了正收益。最终轮动模型年化收益4.4%,超出上证综指5.7%;最大回撤10.7%,小于上证综指的 14.6%。图图 3131:行业轮动模型收益:行业轮动模型收益 资料来源:Wind,渤海证券研究所 4 4总结与未来研究方向展望总结与未来研究方向展望 本篇报告中,我们使用随机森林算法建立了择时模型,并应用于申万 28 个行业指数,构建行业轮动模型。该模型还有很大的改进空间。接下来,我们的研究重点 权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 16 of 19 将主要从三方面展开。1)丰富择时选项。为突出策略的简单直接,本篇报告中我们对于下一期标的走势的预测仅包括“涨”和“跌”两个选项,在一些国外参考文献中,对下一期标的预测可以延伸至“暴涨超过 3%”、“微涨”、“微跌”、“暴跌超过 3%”四个选项,并给出每个选项的发生概率。在本篇报告中,我们本来尝试了使用四个选项进行分类,但分类效果不如使用两个选项的版本。未来我们会继续改进模型,使模型的预测提供更多信息。2)择时模型可以与行业 ETF 投资结合,构建 ETF 轮动模型。但现在市场上行业ETF 未能覆盖全行业,且还需考虑 ETF 追踪误差等问题,需要与基金研究相结合。3)与分行业多因子模型结合,先由行业轮动模型确定下一期看好行业,再通过该行业多因子模型进行选股,实现自上而下的选股流程。这也是该模型的建立初衷。风险提示:风险提示:随着市场环境变化,模型存在失效风险。权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 17 of 19 投资评级说明投资评级说明 项目名称 投资评级 评级说明 公司评级标准 买入 未来 6 个月内相对沪深 300 指数涨幅超过 20%增持 未来 6 个月内相对沪深 300 指数涨幅介于 10%20%之间 中性 未来 6 个月内相对沪深 300 指数涨幅介于-10%10%之间 减持 未来 6 个月内相对沪深 300 指数跌幅超过 10%行业评级标准 看好 未来 12 个月内相对于沪深 300 指数涨幅超过 10%中性 未来 12 个月内相对于沪深 300 指数涨幅介于-10%-10%之间 看淡 未来 12 个月内相对于沪深 300 指数跌幅超过 10%重要声明重要声明:本报告中的信息均来源于已公开的资料,我公司对这些信息的准确性和完整性不作任何保证,不保证该信息未经任何更新,也不保证本公司做出的任何建议不会发生任何变更。在任何情况下,报告中的信息或所表达的意见并不构成所述证券买卖的出价或询价。在任何情况下,我公司不就本报告中的任何内容对任何投资做出任何形式的担保,投资者自主作出投资决策并自行承担投资风险。我公司及其关联机构可能会持有报告中提到的公司所发行的证券并进行交易,还可能为这些公司提供或争取提供投资银行或财务顾问服务。我公司的关联机构或个人可能在本报告公开发表之前已经使用或了解其中的信息。本报告的版权归渤海证券股份有限公司所有,未获得渤海证券股份有限公司事先书面授权,任何人不得对本报告进行任何形式的发布、复制。如引用、刊发,需注明出处为“渤海证券股份有限公司”,也不得对本报告进行有悖原意的删节和修改。权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 18 of 19 副所长(金融行业研究研究所主持工作)张继袖+86 22 2845 1845 副所长 谢富华+86 22 2845 1985 计算机行业研究小组 王洪磊(部门副经理)+86 22 2845 1975 朱晟君+86 22 2386 1319 王磊 汽车行业研究小组 郑连声+86 22 2845 1904 张冬明+86 22 2845 1857 环保行业研究 张敬华+86 10 6810 4651 刘蕾+86 10 6810 4662 电力设备与新能源行业研究 刘瑀+86 22 2386 1670 刘秀峰+86 10 6810 4658 医药行业研究小组 张冬明+86 22 2845 1857 赵波+86 22 2845 1632 甘英健 通信电子行业研究小组 徐勇+86 10 6810 4602 餐饮旅游行业研究 刘瑀+86 22 2386 1670 杨旭+86 22 2845 1879 证券行业研究 张继袖+86 22 2845 1845 洪程程+86 10 6810 4609 金融工程研究部门经理 崔健+86 22 2845 1618 权益类量化研究 李莘泰+86 22 2387 3122 宋旸+86 22 2845 1131 衍生品类研究 祝涛+86 22 2845 1653 李元玮+86 22 2387 3121 郝倞+86 22 2386 1600 债券研究 王琛皞+86 22 2845 1802 冯振+86 22 2845 1605 夏捷+86 22 2386 1355 基金研究 刘洋+86 22 2386 1563 流动性、战略研究部门经理 周喜+86 22 2845 1972 策略研究 宋亦威+86 22 2386 1608 杜乃璇+86 22 2845 1945 宏观研究 张扬 博士后工作站 朱林宁 资产配置+86 22 2387 3123 综合质控部门经理 齐艳莉+86 22 2845 1625 机构销售投资顾问 朱艳君+86 22 2845 1995 风控专员 白骐玮+86 22 2845 1659 合规专员 任宪功+86 10 6810 4615 渤海证券股份有限公司研究所渤海证券股份有限公司研究所 权益专题报告权益专题报告 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 19 of 19 渤海证券研究所渤海证券研究所 天津 天津市南开区宾水西道 8 号 邮政编码:300381 电话:(022)28451888 传真:(022)28451615 北京 北京市西城区西直门外大街甲 143 号 凯旋大厦 A 座 2 层 邮政编码:100086 电话:(010)68104192 传真:(010)68104192 渤海证券研究所网址:

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开