温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
拾穗
因子
系列
报告
数据
异常
处理
比较
实践
20190317
证券
23
金金工点评金金工点评 公司公司研究研究 财通证券研究所财通证券研究所 2012019 9 年年 0303 月月 1717 日日 数据数据异常值处理异常值处理:比较比较与实践与实践 计算机软件与服务计算机软件与服务 证券证券研究报告研究报告 金融工程金融工程 投资要点:投资要点:数据异常值处理数据异常值处理:比较与实践比较与实践 在进行回归分析或因子相关性分析时,因子暴露的异常值可能会极大影响回归系数和数据的相关系数。常用的异常值处理方法有均值标准差修正法、固定比率修正法、中位数去极值法、Beat G.Briner 方法、因子排序值标准化法、箱形图法和无量纲处理方法,这些方法各有优劣。相较于价量因子,财务数据特别是增长率类数据所含的异常值更多。经实证检验,对于各类数据而言,中位数去极值法和箱形图法是更为稳健的方法。相较于传统的 OLS 回归法,基于分位数回归的方法更不容易受极端值影响,且能够更为全面地描述被解释变量条件分布的全貌。市场风格解析市场风格解析 整体来讲,在过去的一个月中,高 Beta、高波动的股票能够获得相对较高的收益,而大规模、前期涨幅过高的股票后市走势将会出现更为明显的回撤。指数风险预测指数风险预测 所有样本指数在未来一个月的年化波动区间在 21%-31%之间,相较上周出现小幅攀升,财通金工特别提醒投资者注意当前市场的波动情况。指数成分收益归因指数成分收益归因 上周市场风格并不明朗,在表现占优的三只指数中,有以大盘、价值为代表的 380价值指数,也有以中小盘、成长为代表的中证 800指数,而在表现较差的三只指数中,有以大盘为代表的超大盘指数,也有以小盘为代表的创业板指数。风险提示:风险提示:本报告统计结果基于历史数据,过去数据不代表未来,市场风格变化可能导致模型失效。财通证券研究所财通证券研究所 “拾穗”多因子系列报告(第“拾穗”多因子系列报告(第 5 期)期)请阅读请阅读最后一页的重要声明最后一页的重要声明 以才聚财以才聚财,财通天下,财通天下 证券证券研究报告研究报告 联系联系信息信息 陶勤英陶勤英 分析师分析师 SAC 证书编号:S0160517100002 021-68592393 张宇张宇 联系人联系人 176216888421 021-68592220 相关报告相关报告 【1】“星火”多因子系列(一):Barra 模型初探:A 股市场风格解析【2】“星火”多因子系列(二):Barra 模型进阶:多因子模型风险预测【3】“星火”多因子系列(三):Barra 模型深化:纯因子组合构建【4】“拾穗”多因子系列(一):带约束的加权最小二乘:一种解析解法【5】“拾穗”多因子系列(二):你看到的不一定是你所想的:解密 R 方【6】“拾穗”多因子系列(三):行业因子选取:中信一级还是申万一级?【7】“拾穗”多因子系列(四):总市值、流通市值、自由流通市值:谈谈取舍 谨请参阅尾页重要声明及谨请参阅尾页重要声明及财通财通证券股票和行业评级标准证券股票和行业评级标准 2 证券研究报告证券研究报告 金工点评金工点评 内容目录内容目录 1 1、数据异常值处理的常用方法比较与实践数据异常值处理的常用方法比较与实践 .3 3 1.1 初识:异常值的危害.3 1.2 探析:常用异常值处理方法介绍.4 1.3 比较:异常值处理方法的优劣性分析.8 1.4 检验:不同方法对于不同类别数据处理结果.9 1.5 规避:基于分位数回归的方法.13 1.6 小结.14 2 2、一周行情回顾一周行情回顾 .1515 3 3、市场风格解析及指数风险预测市场风格解析及指数风险预测 .1616 3.1 市场风格解析.16 3.2 指数风险预测.18 4 4、指数成分收益归因:指数成分收益归因:.1919 5 5、附录附录 .2121 图表目录图表目录 图图 1 1:单季度净利润同比增长率:单季度净利润同比增长率 VSVS 单季度营业收入同比增长率单季度营业收入同比增长率.3 图图 2 2:异常值处理的主要方法介绍:异常值处理的主要方法介绍.4 图图 3 3:箱形图处理方法示意图:箱形图处理方法示意图.6 图图 4 4:单季度净利润同比增长率散点图:单季度净利润同比增长率散点图.10 图图 5 5:单季度净利润同比增长率因子异常值处理后对比图:单季度净利润同比增长率因子异常值处理后对比图.10 图图 6 6:资产负债率因子散点图:资产负债率因子散点图.11 图图 7 7:资产负债率因子异常值处理后对比图:资产负债率因子异常值处理后对比图.11 图图 8 8:对数市值因子散点图:对数市值因子散点图.12 图图 9 9:对数市值因子异常值处理后对比图:对数市值因子异常值处理后对比图.12 图图 1010:分位数回归与:分位数回归与 OLSOLS 回归结果对比回归结果对比.13 图图 1111:上周主要指数收益(:上周主要指数收益(2019.3.82019.3.8-2019.3.152019.3.15).15 图图 1212:上周:上周中信一级行业指数收益(中信一级行业指数收益(2019.3.82019.3.8-2019.3.152019.3.15).15 图图 1313:近两周纯风格因子收益比较(:近两周纯风格因子收益比较(2019.3.12019.3.1-2019.3.152019.3.15).16 图图 1414:最近一个月风格因子净值走势(:最近一个月风格因子净值走势(2019.2.132019.2.13-2019.3.152019.3.15).17 图图 1515:最近一个月风格因子累计收益(:最近一个月风格因子累计收益(2019.2.132019.2.13-2019.3.152019.3.15).17 图图 1616:财通金工样本指数未来一月波动预测(年化)(:财通金工样本指数未来一月波动预测(年化)(2019.3.152019.3.15-2019.4.122019.4.12).18 图图 1717:收益回归:收益回归/风险预测样本股票占指数成分股比率风险预测样本股票占指数成分股比率.18 图图 1818:上周表现最好三指:上周表现最好三指数因子暴露度数因子暴露度.19 图图 1919:上周表现最差三指数因子暴露度:上周表现最差三指数因子暴露度.19 表表 1 1:各种方法处理后两列数据相关系数:各种方法处理后两列数据相关系数.4 表表 2 2:上周纯风格因子收益(:上周纯风格因子收益(2019.3.112019.3.11-2019.3.152019.3.15).16 表表 3 3:指数在风格因子上的暴露程度(:指数在风格因子上的暴露程度(2019.3.152019.3.15).20 谨请参阅尾页重要声明及谨请参阅尾页重要声明及财通财通证券股票和行业评级标准证券股票和行业评级标准 3 证券研究报告证券研究报告 金工点评金工点评 在实际投资中,多因子模型被广泛地应用到资产定价、绩效归因、风险控制、组合优化、基金评价及资产配置等各个领域,一套完整、精细的多因子系统成为每位量化研究者必备的工具。“做最实用的研究”,是财通金工给自己的定位。“做最实用的研究”,是财通金工给自己的定位。我们将在之后的系列报告中,就投资者们最关心也最容易忽略的很多细节问题进行探讨,介绍我们在实际应用中遇到的问题和思考,以飨读者。我们为本系列报告取名“拾穗”。一周市场风云变幻,和风细雨也好,狂风骤雨也罢,都留下一地故事等待梳理。作为勤劳的搬运工,财通金工从量化视角出发对市场风格进行捕捉、对风险水平进行预测,既是希望能够如拾穗者般专心、踏实地做研究,也是祝愿各位投资者能够在市场收获满地金黄。本期是该系列报告的第本期是该系列报告的第五五期,期,主要就数据处理过程中异常值的识别及处理方主要就数据处理过程中异常值的识别及处理方法进行介绍,并在实证检验中探讨对于不同类别法进行介绍,并在实证检验中探讨对于不同类别的的数据(如财务类因子和价量类数据(如财务类因子和价量类因子),何种方法更为合适因子),何种方法更为合适。1 1、数据异常值处理的常用方法比较与实践数据异常值处理的常用方法比较与实践 如果将整套量化系统比喻成一座宫殿,那么数据就是构建这座宫殿的基石。在现实研究中,这些基石并不总是令人满意,它们或大或小、或有或无,如何根据设计师的设想对这些基石进行雕琢,便是每位量化研究者的基础工作。异常值异常值的存在对于数据集的存在对于数据集所所含的信息会造成哪些损害?常用的异常值识别及处理方法含的信息会造成哪些损害?常用的异常值识别及处理方法有哪些?这些方法的优劣及适用范围究竟如何?有哪些?这些方法的优劣及适用范围究竟如何?即便存在异常值,是否有一些特即便存在异常值,是否有一些特定方法对此进行规避?定方法对此进行规避?本文本文将围绕上述将围绕上述问题展开讨论。问题展开讨论。1.1 1.1 初识:异常值的危害初识:异常值的危害 在实际研究中,如果数据集的极值与异常值较多,可能会导致多因子模型在进行回归及相关性分析时误差较大。在处理因子暴露数据时,容易出现一些极端的异常值数据,或是不太符合实际的极端值,因此对极端值和异常值的识别和处理便显得尤为重要。当我们进行回归分析或因子相关性分析时当我们进行回归分析或因子相关性分析时,因子暴露的异常,因子暴露的异常值可能会极大影响回归系数及相关系数。值可能会极大影响回归系数及相关系数。图图1 1:单季度净利润同比增长率单季度净利润同比增长率VSVS单季度营业收入同比增长率单季度营业收入同比增长率 数据来源:财通证券研究所数据来源:财通证券研究所,WindWind 谨请参阅尾页重要声明及谨请参阅尾页重要声明及财通财通证券股票和行业评级标准证券股票和行业评级标准 4 证券研究报告证券研究报告 金工点评金工点评 财通金工以单季度净利润同比增长率(YOY_Profit)和单季度营业收入同比增长率(YOY_Sales)为例对此进行说明,这两个指标是构建股票成长类因子(Growth)的细分因子。从直观含义来讲,二者之间应该存在同向的相关关系,对其绘制散点图如图1左上角所示。与一般的价量因子不同,财务因子特别是增长率因子,通常是将本期指标与前期指标相除减1得到,若期初数据过小而本期经过较大幅度的增长,那么增长率数据将会求得一个异常大的数值。因此,增长率类的因子通常并不服从正态分布,且更容易出现极端值。由如图1左上角可以看到,由于两列数据都存在极端异常值,散点图无法看出二者之间的相关关系,经计算二者相关系数仅为0.0025,若仅凭该指标来判断,二者几乎不存在相关关系,这显然与我们的预期不符。如果把原始数据中的异常值用几种不同的方法进行处理,从散点图和Pearson相关系数中可以发现数据之间相关性明显增大,且经过中位数去极值法和箱形图方法处理异常值后数据呈现的相关关系更加明显。表表 1 1:各种方法处理后两列数据相关系数各种方法处理后两列数据相关系数 处理方法 原始数据 均值标准差修正法 固定比率修正法 中位数去极值法 Beat G.Briner 箱形图法 相关系数 0.0025 0.0256 0.2879 0.3369 0.0237 0.3428 数据来源:财通证券研究所,数据来源:财通证券研究所,WindWind 1.2 1.2 探析探析:常用异常值处理方法介绍常用异常值处理方法介绍 本小节就实际投资和相关文献中,异常值处理常用的均值标准差修正法(3法)、固定比率修正法(百分位法)、中位数去极值法(MAD 法)、Beat G.Briner方法、因子排序值标准化法、箱形图方法和无量纲化处理方法进行介绍。图图 2 2:异常值处理的主要方法介绍异常值处理的主要方法介绍 数据来源:财通证券研究所数据来源:财通证券研究所 谨请参阅尾页重要声明及谨请参阅尾页重要声明及财通财通证券股票和行业评级标准证券股票和行业评级标准 5 证券研究报告证券研究报告 金工点评金工点评 (1)均值标准差修正法(3法)假定已知数据 x 服从正态分布,现在需向该数据集中新增一个数据,那么该数据位于数据集平均值3以外的概率可以表示为:(|3)=(|3)令=(0,1),则由正态分布查表可知,(|3)+3 3,98 2,()+(),3(),3 ()33(1 ()+()(),()1,则剔除排序后最大值方向的端点值 重复 1)和 2),直至出现 1的情形。规则 3:在循环停止之后,假设出现了 m 个 0的情况。1)当 m=1(或 2)且 时,可以认为排序后数据最大值方向的端点值(或最大端点值与次大端点值)为异常值。2)当 3 /2时,可以认为所有 对应的端点值为异常值。3)当 /2且 对应的点很多时,剔除中较大异常值对应的数据,并计算剩余数据的平均值,将在其平均值以上的计数步对应的原始数据剔除。最小值方向的异常值识别过程与上述类似,只是将规则 2 第二步中的=2()/1()且从最小值方向剔除极端值即可。为了进一步判断数据的另一端是否存在异常值,将上述识别出的异常值删除并按规则 1 重新判断。当对剩余数据判断异常值存在的方向与之前相同时,则认为剩余数据中不存在异常值;反之,可进一步按上述异常值的识别规则判断剩余数据中是否存在异常值。至此,就已经完成了异常值的识别,接下来开始对异常值进行处理。假设排序后数据集共 n 个数据,若最小值方向存在 k 个异常值,记为,最大值方向存在 h 个异常值,记为,非异常值共 t 个,记为,那么肯定有如下等式:=+令1=,2=,则异常值处理后数据如下:=1 =(1 2)+2 =1+(1 21)可以看到,该方法并不只是将异常值进行简单的拉回操作,而是将识别出来的极端异常值之间进行比较和规整化。最终处理得到的数据在0,1之间,且保留了异常值本身的信息。谨请参阅尾页重要声明及谨请参阅尾页重要声明及财通财通证券股票和行业评级标准证券股票和行业评级标准 8 证券研究报告证券研究报告 金工点评金工点评 1.3 1.3 比较:异常值处理方法的优劣性分析比较:异常值处理方法的优劣性分析 上一部分我们对 7 种异常值的处理方法进行了介绍,本小节我们从定性的角度来谈谈财通金工对于这些方法优缺点的理解。(1)均值标准差修正法(3法)优点:该方法实用性较强,能够识别出偏离较大的异常值,逻辑容易理解。缺点:a)用标准差度量具体可能会放大偏离较为严重的点的偏离影响,若有部分极端的异常值出现,可能会极大地放大,导致上下界过宽,无法筛选部分异常值。b)该方法的前提条件是数据集分布近似服从正态分布,对于不满足正态分布且数据量不够多的数据集,该方法可能会存在一定的误差。(2)固定比率修正法(百分位法)优点:处理方便,逻辑容易理解,若数据两端都存在异常值且比例相似,则效果较好。缺点:a)该数据异常值处理方法与其余方法相比的最大不同点在于,它仅仅以数据在因子值中的比例而不以异常偏离程度筛选异常值。因此当数据较为集中时,或者数据集本身并没有异常值出现时,该方法依然要以一定比例处理和改变两头的极端值,存在一定的误差。b)百分比的比例选择太过主观,可能会与数据集实际异常值的比例相差较大。(3)中位数去极值法(MAD 方法)优点:该方法用中位数作为中心点,并且用各点距离中心的中位数定义 MAD。中位数和绝对值距离相较于均值和标准差而言,能够减少极端值的影响,使得异常值的判断更为准确。缺点:超过异常值的点在处理过后拉回上下界,可能会导致()处出现数据堆叠,与现实中数据分布情况不同。(4)Beat G.Briner 方法 优点:将标准化后的因子值限制在-3.5,3.5上,而且保留了原始数据的排序,不会使处理后的异常值堆叠在限制值两端。缺点:a)一定程度上认为数据服从正态分布。b)在异常值处理之前用均值和标准差对数据进行标准化,此时计算出的均值和标准差可能会较大得受到异常值的影响,使得标准化后的数据存在一定误差。谨请参阅尾页重要声明及谨请参阅尾页重要声明及财通财通证券股票和行业评级标准证券股票和行业评级标准 9 证券研究报告证券研究报告 金工点评金工点评 (5)箱形图法 优点:运用上下四分位数的数值和上下分位数之差确定上下界,可忽略极端值的影响,得出较为理想的上下界。缺点:与 MAD 方法相似,超过异常值的点在处理过后拉回上下界,造成上下界数据堆叠,与现实中数据分布情况不同。(6)因子排序值标准化法 优点:处理简便,且有利于做相关性分析 缺点:完全忽视所有因子本身的数值大小,因此实际处理中丢失较多信息,误差较大,无法适用于多因子模型。(7)无量纲处理方法 优点:将异常值处理后的数据限制在0,1,并保留了原始数据的排序。用极值到中位数的绝对距离而非标准差来评判,能够减少极端值的影响。缺点:a)对数据集两端都存在异常值且两端异常值距中位数距离相近的数据集处理效果不好 b)通常只能识别一端的异常值。c)由于异常值部分的处理公式是根据异常值中的极大极小值进行的,与正常值处理的公式不同,因此如果一端的异常值太大,且异常值识别较多,可能出现断层现象。1.4 1.4 检验:不同方法对于不同类别数据处理结果检验:不同方法对于不同类别数据处理结果 本小节我们从实证层面出发,对财务类数据和价量类数据的异常值进行处理,本小节我们从实证层面出发,对财务类数据和价量类数据的异常值进行处理,观察各个方法在实际应用中的适用范围。观察各个方法在实际应用中的适用范围。通常来讲,价量因子的异常值比财务类数据的异常值小得多,因此对其进行处理更为简单,各种方法的差别不会太大。而对于财务类因子特别是增长率类型的因子,出现极端值的可能性大大增加。我们以单季度净利润同比增长率、资产负债率和市值因子对此进行说明。图4展示了2019年3月8日全市场股票单季度净利润同比增长率因子的散点图。可以看到,该组数据存在十分极端的异常值,且异常值在数据的两端分布较为均匀。图5展示了经过前述方法进行极值处理后的效果,可以发现,对于异常值较多且十分极端的数据集,均值标准差修正法和Beat G.Briner提出的方法效果并不理想,主要原因是这两种方法都用到了异常值处理之前的标准差数据,此时标准差受极端异常值的影响非常大,使得异常值的上下界太宽,识别出的异常值过小。同时,无量纲化方法对于该组数据的处理结果也不理想,主要原因是此时两端据中位数距离较为相似,仅识别出两个极小异常值点,其余异常值均无法识别,导致上下界过大。对于这种类型的数据,采用中位数去极值法和箱形图方法的处理效果较好。主要原因是,它主要原因是,它们在处理过程中均未使用标准差指标,使得极端值对们在处理过程中均未使用标准差指标,使得极端值对于确定上下界的影响较小。于确定上下界的影响较小。谨请参阅尾页重要声明及谨请参阅尾页重要声明及财通财通证券股票和行业评级标准证券股票和行业评级标准 10 证券研究报告证券研究报告 金工点评金工点评 图图4 4:单季度净利润同比增长率散点图单季度净利润同比增长率散点图 数据来源:财通证券研究所数据来源:财通证券研究所,WindWind 图图5 5:单季度净利润同比增长率因子异常值单季度净利润同比增长率因子异常值处理后处理后对比对比图图 数据来源:财通证券研究所数据来源:财通证券研究所,WindWind 图6展示了2019年3月8日全市场股票资产负债率因子的散点图。与单季度利润同比增长率因子不同,资产负债率因子的极端值更多地分布在数据的一端(最大值方向),并不存在异常数据的对称性,且原始数据集的标准差相对较小。图7展示了经过前述方法进行极值处理后的效果,可以发现,对于这种原始数据异常值相对较小且单方面分布于数据一端的数据,通过6种方法进行处理后的结果 谨请参阅尾页重要声明及谨请参阅尾页重要声明及财通财通证券股票和行业评级标准证券股票和行业评级标准 11 证券研究报告证券研究报告 金工点评金工点评 均优于异常值较大的原始数据。在所有方法中,仍以中位数去极值和箱形图方法的效果最为令人满意。前面提到,由于无量纲处理方法对于异常值部分的处理是根据异常值中的极大极小值进行的,与正常值处理的公式不同,因此如果一端的异常值太大,且异常值识别较多,可能出现断层现象,图7右下角即展示了这一结果。图图6 6:资产负债率因子散点图资产负债率因子散点图 数据来源:财通证券研究所数据来源:财通证券研究所,WindWind 图图7 7:资产负债率因子异常值处理后对比图资产负债率因子异常值处理后对比图 数据来源:财通证券研究所数据来源:财通证券研究所,WindWind 谨请参阅尾页重要声明及谨请参阅尾页重要声明及财通财通证券股票和行业评级标准证券股票和行业评级标准 12 证券研究报告证券研究报告 金工点评金工点评 图8和图9以对数市值因子为例,展示了处理前后的效果。由于原始数据本身并不存在很多异常值点,因此对于这样的数据而言,所有方法的处理结果都令人合意。图图8 8:对数对数市值因子散点图市值因子散点图 数据来源:财通证券研究所数据来源:财通证券研究所,WindWind 图图9 9:对数对数市值因子异常值处理后对比图市值因子异常值处理后对比图 数据来源:财通证券研究所数据来源:财通证券研究所,WindWind 谨请参阅尾页重要声明及谨请参阅尾页重要声明及财通财通证券股票和行业评级标准证券股票和行业评级标准 13 证券研究报告证券研究报告 金工点评金工点评 1.5 1.5 规避规避:基于分位数回归的方法基于分位数回归的方法 到目前为止,我们对于异常值的处理均是基于“识别-拉回”这样的两步操作,本小节我们介绍一种分位数回归方法(Quantile Regression),它最早由Koenker和Bassett(1978)提出。相对于OLS方法而言,这种方法对于离群点的处理表现更为稳健,且对误差项并不作强假设要求,因此对于非正态分布数据而言,分位数回归的系数估计量更为稳健。传统的回归模型实际上是研究被解释变量的条件期望(即平均值),但往往我们也关心解释变量与被解释变量分布的中位数、分位数等呈现出怎样的关系。因此,分位数回归能够更全面地描述被解释变量条件分布的全貌,而不仅仅是分析解释变量对被解释变量的均值的影响。此外,传统的OLS方法其最小化目标函数为残差平方和,这容易受极端值影响,而分位数回归方法使用残差绝对值的加权平均作为最小化目标函数,不容易受极端值影响,因此更为稳健。图10以家庭收入与食品支出的关系为例,对比了分位数回归与OLS回归的结果。在该原始数据集中,由于家庭收入数据存在部分极端值,因此OLS回归的截距项更大,受到极端值的影响比分位数回归更大一些。图图1010:分位数回归与分位数回归与OLSOLS回归结果对比回归结果对比 数据来源:财通证券研究所数据来源:财通证券研究所 由于不是本文讨论的重点,对于分位数回归方法的具体细节本文不进行过多赘述,仅以一个例子对其进行说明,为投资者提供一定的思路,感兴趣的客户欢迎与我们进行深入探讨。谨请参阅尾页重要声明及谨请参阅尾页重要声明及财通财通证券股票和行业评级标准证券股票和行业评级标准 14 证券研究报告证券研究报告 金工点评金工点评 1.6 1.6 小结小结 本文主要讨论多因子模型构建中,异常值数据的识别和处理,首先介绍异常值的存在对数据集所含信息的损害来阐述对异常值进行处理的必要性,随后介绍当前实际投资中运用最为广泛的7类异常值处理方法,并从定性和定量两个维度来分析各种方法的优劣及适用范围,最后介绍分位数回归的方法对异常值进行文件处理,主要结论如下:(1)在进行回归分析或因子相关性分析时,因子暴露的异常值可能会极大影响回归系数和数据的相关情况;(2)常用的异常值处理方法有均值标准差修正法、固定比率修正法、中位数去极值法、Beat G.Briner方法、因子排序值标准化法、箱形图法和无量纲化处理方法,这些方法各有优劣;(3)相较于价量因子数据,财务数据特别是增长率类数据所含的异常值更多。经实证检验,对于各类数据而言,中位数去极值法和箱形图是更为稳健的方法;(4)相较于传统的OLS回归法,基于分位数回归的方法更不容易受极端值影响,且能够更为全面地描述被解释变量条件分布的全貌,是一种更为稳健的回归方法。谨请参阅尾页重要声明及谨请参阅尾页重要声明及财通财通证券股票和行业评级标准证券股票和行业评级标准 15 证券研究报告证券研究报告 金工点评金工点评 2 2、一周行情回顾一周行情回顾 上周市场风格相较前一个月稍有变化,创业板指止住前段时间连续上涨的强势,本周步幅稍有放缓。科创板等概念的火爆带动成长股表现,上周沪深 300 成长和中证 800 成长指数分别上涨 4.96%和 4.50%,在所有样本指数中排名前二,而创业板指数和超大盘指数分别录得 0.49%和 0.88%的收益,总体来讲市场整体风格并不明确。图图1111:上周上周主要指数收益主要指数收益(2 2019.019.3 3.8 8-2019.3.2019.3.1515)数据来源:财通证券研究所数据来源:财通证券研究所,WindWind 行业方面,在所有 29 个中信一级行业中,电力设备和房地产行业分别上涨6.07%和 6.05%,而计算机和通信行业分别收于-3.67%和-2.59%收益,排名垫底。图图1212:上周中信一级上周中信一级行业指数收益行业指数收益(2 2019.019.3 3.8 8-2019.3.2019.3.1515)数据来源:财通证券研究所数据来源:财通证券研究所,WindWind 谨请参阅尾页重要声明及谨请参阅尾页重要声明及财通财通证券股票和行业评级标准证券股票和行业评级标准 16 证券研究报告证券研究报告 金工点评金工点评 3 3、市场风格解析及指数风险预测市场风格解析及指数风险预测 财通金工借鉴 Barra 模型,选取 Beta、规模、动量、波动率、非线性规模、BP、流动性、盈利、成长和杠杆率因子构建收益-风险归因模型,因子定义及计算细节参见附录二。本部分通过对近期风格因子的收益表现进行分析以期捕捉本部分通过对近期风格因子的收益表现进行分析以期捕捉 A股市场的风格变化,同时对财通金工样本指数的未来一月风险进行预测来分析当股市场的风格变化,同时对财通金工样本指数的未来一月风险进行预测来分析当前前 A 股市场所处的风险水平。股市场所处的风险水平。风格因子的收益拆解可参见财通金工专题报告Barra 模型初探:A 股市场风格解析,资产组合的风险预测可参见财通金工专题报告Barra 模型进阶:多因子模型风险预测。3.1 3.1 市场风格解析市场风格解析 各类风格因子在上周的累计收益可分为日度累计收益和周度收益两种,日度累计收益是根据风格因子的日度收益计算得到,周度收益是将股票在本周的收益率对股票在上周最后一个交易日的因子暴露度进行回归得到的因子纯净收益,二者之间的区别在于换仓频率的不同,前者为每日换仓,而后者在每周最后一个交易日换仓。表 2 和图 13 展示了上周各类风格因子的累计收益和周度收益大小,可以看到,二者十分近似。本周本周 Beta 因子继续之前的正向表现,而规模因子、波动率因子继续之前的正向表现,而规模因子、波动率因子和流动性因子均收获负收益,市场在大小盘上的博弈仍然较为激烈。因子和流动性因子均收获负收益,市场在大小盘上的博弈仍然较为激烈。表表2 2:上周上周纯风格因子收益纯风格因子收益(2 2019.3.019.3.1111-2019.3.2019.3.1515)日期 Beta 规模 长期动量 波动率 非线性规模 BP 流动性 盈利 成长 杠杆 2019/3/11 0.22%-0.38%-0.09%-0.41%0.17%0.02%0.00%-0.20%0.18%-0.04%2019/3/12 0.07%-0.23%0.08%0.48%0.12%0.05%-0.17%-0.01%-0.02%-0.04%2019/3/13 0.36%-0.24%0.41%0.04%-0.11%0.01%-0.41%0.09%0.08%-0.02%2019/3/14-0.02%0.41%0.29%-0.54%-0.13%-0.27%0.00%0.37%0.14%-0.13%2019/3/15 0.31%-0.32%0.28%-0.09%-0.07%-0.03%-0.16%0.05%0.02%0.12%上周累计收益 0.95%-0.76%0.97%-0.53%-0.02%-0.23%-0.74%0.30%0.39%-0.11%周度收益 0.93%-0.82%1.05%-0.46%-0.03%-0.16%-0.58%0.34%0.38%-0.11%前一周度收益 0.02%-0.96%-0.59%0.52%0.70%0.63%0.29%-0.92%-0.57%0.32%数据来源:财通证券研究所数据来源:财通证券研究所,WindWind 图图 1313:近两周纯风格因子收益比较(:近两周纯风格因子收益比较(2 2019.019.3 3.1 1-2019.3.2019.3.1515)数据来源:财通证券研究所数据来源:财通证券研究所 谨请参阅尾页重要声明及谨请参阅尾页重要声明及财通财通证券股票和行业评级标准证券股票和行业评级标准 17 证券研究报告证券研究报告 金工点评金工点评 图图1414:最近一个月风格因子净值走势(最近一个月风格因子净值走势(2 2019.019.2 2.1313-2019.3.2019.3.1515)数据来源:财通证券研究所数据来源:财通证券研究所,WindWind 图 14 和图 15 分别展示了最近一个月各类风格因子的净值走势及累计收益,以观察各类风格因子在过去一段时间的持续盈利能力。整体来讲,在过去的一个整体来讲,在过去的一个月中,高月中,高 Beta、高波动高波动的股票能够获得相对较高的收益,而的股票能够获得相对较高的收益,而大大规模、前期涨幅规模、前期涨幅过高的股票后市过高的股票后市将会出现较为明显的回撤。将会出现较为明显的回撤。图图1515:最近一个月风格因子累计收益(最近一个月风格因子累计收益(2 2019.019.2 2.1313-2019.3.2019.3.1515)数据来源:财通证券研究所数据来源:财通证券研究所,WindWind 谨请参阅尾页重要声明及谨请参阅尾页重要声明及财通财通证券股票和行业评级标准证券股票和行业评级标准 18 证券研究报告证券研究报告 金工点评金工点评 3.2 3.2 指数风险预测指数风险预测 对收益的分解仅代表过去对收益的分解仅代表过去,对风险的预测才代表未来对风险的预测才代表未来。多因子模型风险预测将股票风险拆解为共同风险和特质风险两部分,在通过稳健调整对共同风险矩阵和特质风险矩阵进行估计后,即可根据指数的成分股权重来估计指数在未来一段时间的波动情况。为了保证结果的严谨性,此处我们直接采用 Wind 提供的成分股权重数据,而非根据自由流通市值计算得到,尽管二者的结果十分类似。()=(+)图 16 展示了财通金工样本指数在未来一个月的预测波动率,为了方便展示我们将估计的月度波动率进行年化,波动的预测时间为上周最后一个交易日(2019.3.1)。可以看到,所有样本指数未来一月的年化波动区间在可以看到,所有样本指数未来一月的年化波动区间在 21%-31%之之间间,预测波动相较上一周,预测波动相较上一周小幅小幅攀升攀升,财通金工特别提醒投资者注意当前市场波动,财通金工特别提醒投资者注意当前市场波动情况情况,对后市维持谨慎乐观态度,对后市维持谨慎乐观态度。中小板股票中小板股票、成长类指数的风险较大成长类指数的风险较大,而偏大而偏大盘股票盘股票、价值类股票的风险普遍较小价值类股票的风险普遍较小。图图1616:财通金工样本指数未来一月波动预测(年化)(财通金工样本指数未来一月波动预测(年化)(2 2019.3.019.3.1515-2019.4.2019.4.1212)数据来源:财通证券研究所数据来源:财通证券研究所,WindWind 由于在计算股票的风格因子时,我们会对暂停上市的股票、大类因子值存在缺失的股票进行剔除,因此在进行收益归因和风险预测时,并非所有指数成分股都纳入到了模型中,如果缺失股票个数过多或者缺失股票的权重占比过大,将会对模型结果造成较大影响。图 17 展示了各大指数在模型拟合过程中,纳入考虑的股票个数(权重)占指数成分股个数(权重)的比例,可以看到所有指数的比例均在 93%以上,数据质量的拟合较为合意。图图1717:收益回归收益回归/风险预测样本股票占指数成分股比率风险预测样本股票占指数成分股比率 谨请参阅尾页重要声明及谨请参阅尾页重要声明及财通财通证券股票和行业评级标准证券股票和行业评级标准 19 证券研究报告证券研究报告 金工点评金工点评 数据来源:财通证券研究所数据来源:财通证券研究所,WindWind 4 4、指数成分收益归因:指数成分收益归因:本部分财通金工对上周表现最好的三只指数和表现最差的三只指数进行归因分析,以观察涨幅较高(或较低)的指数风险暴露是否展现出较高的趋同性以及两类指数的持股风格是否会表现出明显的差别,其结果如图 18 和图 19 所示。图图1818:上周表现最好三指数因子暴露度:上周表现最好三指数因子暴露度 图图1919:上周上周表现最差三指数因子暴露度表现最差三指数因子暴露度 数据来源:财通证券研究所数据来源:财通证券研究所,WindWind 数据来源:财通证券研究所数据来源:财通证券研究所,WindWind 表 3 展示了各大指数上周在各类因子上的暴露程度,可以看到,上周上周市场风市场风格格并不明朗并不明朗,在表现占优的三只指数中,有以大盘、价值为代表的在表现占优的三只指数中,有以大盘、价值为代表的 380 价值指数价值指数,也有以中小盘也有以中小盘、成长为代表的中证成长为代表的中证 800 指数指数,而在表现较差的三只指数中而在表现较差的三只指数中,有以有以大盘为代表的超大盘指数大盘为代表的超大盘指数,也有以小盘为代表的创业板指数也有以小盘为代表的创业板指数。谨请参阅尾页重要声明及谨请参阅尾页重要声明及财通财通证券股票和行业评级标准证券股票和行业评级标准 20 证券研究报告证券研究报告 金工点评金工点评 表表3 3:指数指数在风格因子上的暴露程度在风格因子上的暴露程度(2 2019.3.019.3.1515)数据来源:财通证券研究所数据来源:财通证券研究所,W Windind 【参考文献】【1】“The Barra Europe Equity Model(EUE3)”,Beat G.Briner,Rachael C.Smith,Paul Ward.2009.6【2】“Quantile Regression”,Roger Koenker,Kevin F.Hallock.Journal of Economic Perspectives.2001【3】综合评价中异常值的识别及无量纲化处理方法,李伟伟,易平涛,李玲玉,运筹与管理,2018.4 注:实习生上海财经大学李迪参与本课题,为本报告作出重要贡献。谨请参阅尾页重要声明及谨请参阅尾页重要声明及财通财通证券股票和行业评级标准证券股票和行业评级标准 21 证券研究报告证券研究报告 金工点评金工点评 5 5、附录附录 附录一:附录一:财通财通金工指数池选取金工指数池选取 上证规模/风格指数 深证综合/规模指数 中证规模/风格指数 000001.SH 上证综指 399101.SZ 中小板综 000300.SH 沪深 300 000002.SH 上证 A 指 399102.SZ 创业板棕 000852.SH 中证 1000 000010.SH 上证 180 399106.SZ 深证综指 000985.CSI 中证全指 000016.SH 上证 50 399107.SZ 深证 A 指 000980.CSI 中证超大 000043.SH 超大盘 399005.SZ 中小板指 000903.SH 中证 100 000044.SH 上证中盘 399006.SZ 创业板指 000905.SH 中证 500 000045.SH 上证小盘 399008.SZ 中小 300 000906.SH 中证 800 000046.SH 上证