温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
证券
_20181017_
数量化
专题
风格
中性
因子
有效性
测试
质量
市场有风险,投资需谨慎 请务必阅读正文之后的免责条款部分 证券研究报告:金融工程 2018 年 10 月 17 日 近期研报 风格中性多因子选股策略初探数量化专题之一 风格中性多因子之因子数据预处理数量化专题之二 风格中性多因子有效性测试之估值因子数量化专题之三 风格中性多因子有效性测试之情绪因子数量化专题之四 研发部 首席分析师:程毅敏 SAC 执业证书编号:S1340511010001 联系电话:010-67017788 Email: 风格中性多因子有效性测试之质量因子 数量化专题之八 前言:前言:多因子选股策略作为量化投资领域的经典模型,在海内外各投资机构均受到广泛的研究以及实践应用。就大陆而言,自从2010年沪深300股指期货上线以来,以多因子选股为代表的阿尔法对冲策略也逐渐走进大众的视野。但是2014年12月以及2017年下半年,阿尔法对冲策略却遭受重大挫折,究其原因可以发现:组合带有过于明显的市值风格特征是导致策略表现不好的主要原因。本系列报告基于对因子的研究,尝试研究因子权重、股票权重对策略风格特征的影响,希望找到在市值中性、行业中性、风格因子中性约束下的最优投资组合,以获得稳健的超额收益。本报告介绍了单因子测试框架:分层回测、回归法、因子IC 值分析;风险提示:单因子测试结果是历史经验的总结,存在失效的可能。请务必阅读正文之后的免责条款部分 2 目录目录 一、引言一、引言 .3 3 二、有效因子识别二、有效因子识别 .4 4 二、单因子测试流程:二、单因子测试流程:.6 6 请务必阅读正文之后的免责条款部分 3 一、一、引言引言 经典的多因子模型表达式为:其中:股票 j 在因子 k 上的因子暴露(因子载荷):因子 k 的因子收益 :股票 j 的残差收益率 我们从统计的角度研究因子收益率变化规律,并且从组合的角度对因子暴露进行管理。多因子模型一般有三种主要的形式:1、宏观经济因子模型:宏观经济因子模型使用可观察到的宏观经济数据序列,比如:通货膨胀、利率等指标,作为股票市场收益率变动的主要解释变量。宏观经济因子模型的主要思想是:股票市场和外边经济之间存在关联,并且试图利用外部经济指标对股票市场收益率进行刻画。宏观经济因子模型在实际操作中遇到的主要问题时数据问题,假设一个包含10 个宏观经济因子和 1000 只股票的模型,如果每个月进行分析,需要进行1000 次回归。其次每个月的回归可能需要 60 个月的数据来估计 10 个宏观经济因子的载荷,这可能会导致严重的估计偏差,因为这些因子载荷并非静态,即使能够在统计意义下精确的描述过去,这些估计值也很难反映当前的情况。2、基本面子因子模型:基本面因子模型使用可观察到的股票自身的基本属性,比如:分红比例、估值水平、成长性、换手率等指标,作为股票市场收益率变动的主要解释变量。基本面因子主要进行横截面分析,确定股票收益率对因子的敏感性(Beta 值),基本面因子一般可以归纳为基本面类、估值类、市场类。3、统计因子模型:统计因子模型则从股票收益率的协方差矩阵中提取统计因子,作为股票市场收益率变动的主要解释变量,常见的统计分析方法有主成分分析(Principal Component Analysis)、最大似然分析(Maximum Likelihood Analysis)和预期最大化分析(Expectations Maximization Analysis)等。统计因子模型的主要缺点是因子自难有直观的含义,并且因子的估计过程很容易受到“伪相关性”影响。Barra 对三种多因子模型都做过分析研究,发现:基本面多因子的模型要明显好于其他两类模型,现在对多因子的研究也主要集中于基本面多因子研究。基本面多因子模型的最基本假设是:具有类似“属性”的股票,在市场是有相似的收益率。这些类似的属性可以是相同的行业、相似的交易属性(例如:交易价格、交易量、市值大小、波动率等)、相似财务属性(来自于三张财务报表的各种比例或者增长率等)、相似的估值属性(pb、pe、ps、pcf 等)。请务必阅读正文之后的免责条款部分 4 多因子模型通过识别这些共同的基本面因子,并且估计收益率对这些因子的敏感性,得出股票或者组合的预期收益率,最后通过风险模型,根据投资者的收益风险偏好挑选合适的股票并进行权重分配。假设一个投资组合由 N 个股票组成,它们在组合中的权重分别为 hp1,hp2,hpN,则组合的收益率为:其中:对于一个包含 N 只股票和 K 个因子的系统,多因子模型本质上是将对 N 只股票的收益风险预测转变成对于 K 个因子的收益风险预测。多因子模型会极大的降低预测工作量。多因子模型的构建主要可以分为如下四个步骤:1、准备工作:包含:数据采集、数据标准化、有效因子识别。2、收益模型 包含:大类因子分析、因子共线性分析、残差异方差分析、多元线性回归、估计因子预期收益以及计算股票预期收益。3、风险模型 包含:计算因子收益率协方差矩阵、残差风险估计。4、优化模型 包含:确定组合的收益目标、确定组合的风险目标、行业权重约束、因子暴露约束、个股上下限约束、二次规划求解组合权重分配以及模拟回溯。本篇报告侧重在因子有效性测试方面。二、二、有效因子识别有效因子识别 有效因子应该满足两个条件:第一,在逻辑上应该和收益率存在一定的相关性;第二,在实证中确实和收益率存在比较明显的相关性。1、单因子回归确定每个因子每期的因子收益 我们仅纳入行业因子,而将市场因子包含在行业因子中,针对因子 k,单因子的回归模型如下:请务必阅读正文之后的免责条款部分 5 上式中,从左到右各项依次表示:股票 j 在第 t 期的收益率;:股票 j 在第 t 期在行业 s 上的暴露,此项为一个 0-1 哑变量,即:如果股票 j 属于 s 行业,则暴露度为 1,否则为 0;:行业 s 在第 t 期的收益率(需回归拟合);:股票 j 在第 t 期在因子 k 上的暴露;:因子 k 在第 t 期的收益率(需回归拟合,在所有截面期上,我们对因子k 进行回归测试,能够得到该因子的因子收益率序列(即所有截面期回归系数构成的序列)和对应的 t 值序列)。2、因子收益率序列 t 检验 是因子在第期的因子收益,为确定因子在第期是否和股票收益率显著相关,即 是否显著不等于 0,我们需要对 进行检验 t:的统计量 :样本的均值:总体的均值:样本的标准差:样本的容量 对于检验,需要进行三个方面的分析:1.值绝对值序列值绝对值序列的均值:对于每一期的截面回归,都可以得到一个因子收益率 的值。对于值序列,首先取绝对值,然后计算|的均值,|是判断因子是否为有效因子的重要指标。之所以要取绝对值,是因为只要值显著不等于 0 即可以认为在当期,因子和收益率存在明显的相关性。但是这种相关性有的时候为正,有的时候为负,如果不取绝对值,则很多正负抵消,会低估因子的有效性;2.值绝对值序列值绝对值序列大于 2 的比例:检验|2 的比例主要是为了保证|平均值的稳定性,避免出现少数数值特别大的样本值拉高均值;3.因子收益率 序列的值检验:对于每一期的截面回归,都可以得到一个因子收益率 ,对于 序列同样需要进行检验,以观察因子收益率序列的方向一致性。基于以上 3 点,我们可以将有效因子分为:收益类因子和风险类因子,所谓有效因子有效因子,就是和收益率存在很明显相关性的因子,即满足前面的的第 请务必阅读正文之后的免责条款部分 6 一点和第二点。根据第三点,我们可以大致将有效因子分成收益类因子和风险类因子。收益类因子收益类因子:即因子收益率 序列的值显著不等于 0,因子收益率的方向性相对明确,这类型的因子,用历史序列对下一期的因子收益进行预测时,相对比较准确,所以称之为收益类因子。风险类因子风险类因子:即因子收益率 序列的值在 0 附近,因子收益率的方向性相对不明确,这类型的因子,用历史序列对下一期的因子收益进行预测时,风险比较大,所以称之为风险类因子。收益类因子是多因子模型超额收益的主要来源,在模型中是需要风险暴露相对多的因子。而风险类因子也需要重点关注,因为风险类因子是进行风险控制的重点,需要风险暴露尽量少。二、单因子测试流程:二、单因子测试流程:(一)、回归法测试(一)、回归法测试 本节中,我们将着眼于实践过程,给出详细的测试流程说明。我们采用回归法来测试因子有效性。具体做法是将因子在第 T 期的暴露度与 T+1 期的股票收益进行线性回归,所得到的回归系数即为因子在 T 期的因子收益率,同时还能得到该因子收益率在本期回归中的显著度水平 t 值。我们的回归模型为:股票 i 在第 T+1 期的收益率:股票 i 在第 T 期第 j 个行业因子上的暴露度(属于该行业则为 1,否则为0):第 T 期第 j 个行业的因子收益率,需回归拟合:股票 i 在在第 T 期因子 d 上的暴露度:第 T 期因子 d 的因子收益率,需回归拟合:股票 i 在第 T 期的残差收益率 在所有截面期上,我们对因子 d 进行回归测试,能够得到该因子的因子收益率序列(即所有截面期回归系数 构成的序列)和对应的 t 值序列。t 值指的是对单个回归系数 的 t 检验统计量,描述的是单个变量显著性,t 值的绝对值大于临界值说明该变量是显著的,即该解释变量(T 期个股在因子 d 的暴露度)是真正影响因变量(T+1 期个股收益率)的一个因素。也就是说,在每个截面期上,对于每个因子的回归方程,我们设:请务必阅读正文之后的免责条款部分 7 假设检验 0:=0 备择假设 1:0 该假设检验对应的 t 统计量:其中()代表回归系数 的标准差的无偏估计量。一般 t 值绝对值大于 2 我们就认为本期回归系数 是显著异于零的(也就是说,本期因子 d 对下期收益率具有显著的解释作用)。需要注意的是,我们在回归模型中加入了行业因素,能在一定程度上规避行业因素对估值因子的影响。并且回归法单因子测试中并未对市值因素的影响进行调整,但是在后续计算因子 IC 值的部分会做一些调整。测试模型构建方法如下:1 股票池:全 A 股,剔除 ST 股票,剔除每个截面期下一交易日停牌的股票。2 回溯区间:2011-01-01 至 2018-08-24。3 截面期:每个自然月的最后一个交易日计算因子暴露度,与下一整个自然月的个股超额收益(以沪深 300 指数为基准)进行回归。4 数据处理方法:a)、因子暴露度具体计算公式见图表;b)、中位数去极值:我们采用 Hubert&Vandervieren(2007)调整后的 boxplot法,在此前的报告风格中性多因子之因子数据预处理数量化专题之二中已经有详细介绍;c)、标准化:将去极值处理后的因子暴露度序列减去其现在的均值、除以其标准差,得到一个新的近似服从 N(0,1)分布的序列,这样做可以让不同因子的暴露度之间具有可比性;d)、缺失值处理:删除缺失值。图表图表 1 1:质量质量因子因子及其含义及其含义 因子因子 含义含义 BLEV 账面杠杆(Book leverage)。计算方法:账面杠杆=非流动负债合计/股东权益 ARTRate 应收账款周转率(Accounts receivable turnover rate)BondsPayableToAsset 应付债券与总资产之比(Bonds payable to total assets)CashRateOfSales 经营活动产生的现金流量净额与营业收入之比(Cash rate of sales)CashToCurrentLiability 现金比率(Cash to current liability)CurrentAssetsRatio 流动资产比率(Current assets ratio)资料来源:WIND 资讯,中邮证券研发部 5 回归权重:由于普通最小二乘回归(OLS)可能会夸大小盘股的影响(因为小盘股的估值等因子出现极端值概率较大,且小盘股数目很多,但占全市场的 请务必阅读正文之后的免责条款部分 8 交易量比重较小),并且回归可能存在异方差性,故我们参考 Barra 手册,采用加权最小二乘回归(WLS),使用个股流通市值的平方根作为权重,此举也有利于消除异方差性。6 因子评价方法:a)、t 值序列绝对值平均值因子显著性的重要判据;b)、t 值序列绝对值大于 2 的占比判断因子的显著性是否稳定;c)、因子收益率序列平均值,以及该均值零假设检验的 t 值判断因子收益率序列是否方向一致,并且显著不为零;d)、t 值序列均值的绝对值除以 t 值序列的标准差结合显著性和波动性,辅助判断因子是否有效、稳健。以 BLEV 因子为例,图表图表 2 2:BLEVBLEV 因子因子 t t 值序列值序列 资料来源:WIND 资讯,中邮证券研发部 其因子检验统计信息如下:图表图表 3 3:BLEVBLEV 因子因子检验统计信息检验统计信息 t 值序列绝对值平均值 2.4676 t 值序列绝对值大于 2 的占比 48.15%t 值序列均值的绝对值除以 t 值序列的标准差 0.3435 因子收益率序列平均值-0.0048 因子收益率序列平均值零假设检验的 t 值-3.1109 资料来源:WIND 资讯,中邮证券研发部(二)、因子(二)、因子 IC 值的计算值的计算 因子的 IC 的计算一般有两种方法:1、该期因子对股票的下期收益的预测值和股票下期的实际回报值在横截面上的相关系数,即:请务必阅读正文之后的免责条款部分 9 其中,ICA代表因子 A 在该期的 IC 值,为该期因子 A 对股票下期收益率的预测向量,为股票下期实际收益率向量。2、因子在第 T 期的暴露度与 T+1 期的股票收益的相关系数,即 其中,ICA代表因子 A 在第 T 期的 IC 值,代表所有个股第 T+1 期的收益率向量,代表所有个股第 T 期在因子 A 上的暴露度向量。本测试中,我们采用第二种方法,测试模型构建方法如下:1.股票池、回溯区间、截面期均与回归法相同。2.因子值在去极值、标准化、去空值处理后,在截面期上用其做因变量对市值因子及行业因子(哑变量)做线性回归,取残差作为因子值的一个替代。这样做可以消除行业因素和市值因素对因子的影响。计算残差序列和 T+1 期股票收益序列的相关系数作为 T 期因子 IC 值。3.因子评价方法:a)、IC 值序列的均值大小因子显著性;b)、IC 值序列的标准差因子稳定性;c)、IR 比率(IC 值序列均值与标准差的比值)因子有效性;d)、IC 值累积曲线随时间变化效果是否稳定;e)、IC 值序列大于零的占比因子作用方向是否稳定。IC 值反映模型整体线性拟合优度,t 值反映被测单因子对模型的解释能力是否显著,这两者反映的信息都属于因子稳健性信息;因子收益率与前两者差别较大,它反映的是可能获得的收益率的大小,而对这个收益是否稳健未知。同样以 BLEV 因子为例,图表图表 4 4:BLEV因子因子 IC IC 值序列值序列 资料来源:WIND 资讯,中邮证券研发部 其因子检验统计信息如下:请务必阅读正文之后的免责条款部分 10 图表图表 5 5:BLEV因子检因子检验统计信息验统计信息 IC 值序列的均值大小-0.0199 IC 值序列绝对值的均值大小 0.0377 IC 值序列的标准差 0.0423 IC 值序列大于零的占比 20.37%IR 比率-0.4699 资料来源:WIND 资讯,中邮证券研发部 IC 值累积曲线如下:图表图表 6 6:ICIC 值累积曲线值累积曲线(BLEV因子因子)资料来源:WIND 资讯,中邮证券研发部(三三)、)、分层模型回测分层模型回测 依照因子值对股票进行打分,构建投资组合回测,是最直观的衡量指标优劣的手段。一般来说,通过回归法和计算因子 IC 值都无法确定因子的单调性(例如,某因子值排名在中间 1/3 的个股表现比前 1/3 和后 1/3 的个股表现要好),但是分层回测法是可以确定因子单调性的。分层回测法逻辑简单,结果清晰,操作方便,并且具有能区分因子单调性的独特优势,是接受度非常高的一种单因子测试手段。依照因子值对股票进行打分,构建投资组合回测,是最直观的衡量指标优劣的手段。一般来说,通过回归法和计算因子 IC 值都无法确定因子的单调性(例如,某因子值排名在中间 1/3 的个股表现比前 1/3 和后 1/3 的个股表现要好),但是分层回测法是可以确定因子单调性的。分层回测法逻辑简单,结果清晰,操作方便,并且具有能区分因子单调性的独特优势,是接受度非常高的一种单因子测试手段。测试模型构建方法如下:1.股票池与回归法相同,回溯区间:2017-07-01 至 2018-06-01。2.换仓期:在每个自然月最后一个交易日核算因子值,在下个自然月首个交易日按当日收盘价换仓。请务必阅读正文之后的免责条款部分 11 3.分层方法:在每个一级行业内部对所有个股按因子大小因子大小进行排序,每个行业内均分成 N 个分层组合。同样以 BLEV0 因子为例:图表图表 7 7:BLEV因子分层组合回测净值因子分层组合回测净值(以(以 0 0 分位为例)分位为例)资料来源:WIND 资讯,中邮证券研发部 请务必阅读正文之后的免责条款部分 12 中邮证券投资评级标准中邮证券投资评级标准 股票投资评级标准:推荐:预计未来 6 个月内,股票涨幅高于沪深 300 指数 20%以上;谨慎推荐:预计未来 6 个月内,股票涨幅高于沪深 300 指数 10%20%;中性:预计未来 6 个月内,股票涨幅介于沪深 300 指数-10%10%之间;回避:预计未来 6 个月内,股票涨幅低于沪深 300 指数 10%以上;行业投资评级标准:强于大市:预计未来 6 个月内,行业指数涨幅高于沪深 300 指数 5%以上;中性:预计未来 6 个月内,行业指数涨幅介于沪深 300 指数-5%5%之间;弱于大市:预计未来 6 个月内,行业指数涨幅低于沪深 300 指数 5%以上;可转债投资评级标准:推荐:预计未来 6 个月内,可转债涨幅高于中信标普可转债指数 10%以上;谨慎推荐:预计未来 6 个月内,可转债涨幅高于中信标普可转债指数 5%10%;中性:预计未来 6 个月内,可转债涨幅介于中信标普可转债指数-5%5%之间;回避:预计未来 6 个月内,可转债涨幅低于中信标普可转债指数 5%以上;分析师声明分析师声明 撰写此报告的分析师(一人或多人)承诺本机构、本人以及财产利害关系人与所评价或推荐的证券无利害关系。本报告所采用的数据均来自我们认为可靠的目前已公开的信息,并通过独立判断并得出结论,力求独立、客观、公平,报告结论不受本公司其他部门和人员以及证券发行人、上市公司、基金公司、证券资产管理公司、特定客户等利益相关方的干涉和影响,特此声明。免责声明免责声明 中邮证券有限责任公司具备经中国证监会批准的开展证券投资咨询业务的业务资格。本报告信息均来源于公开资料或者我们认为可靠的资料,我们力求但不保证这些信息的准确性和完整性。报告内容仅供参考,报告中的信息或所表达观点不构成所涉证券买卖的出价或询价,中邮证券有限责任公司不对因使用本报告的内容而引致的损失承担任何责任。客户不应以本报告取代其独立判断或仅根据本报告做出决策。中邮证券有限责任公司可发出其它与本报告所载信息不一致及有不同结论的报告。报告所载资料、意见及推测仅反映研究人员于发出本报告当日的判断,可随时更改且不予通告。中邮证券有限责任公司及其所属关联机构可能会持有报告中提到的公司所发行的证券头寸并进行交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者其他金融产品等相关服务。证券期货投资者适当性管理办法 于 2017 年 7 月 1 日起正式实施,本报告仅供本公司客户中的专业投资者使用,若您非本公司客户中的专业投资者,为控制投资风险,请取消接收、订阅或使用本报告中的任何信息。本公司不会因接收人收到、阅读或关注本报告中的内容而视其为客户。本报告版权仅为中邮证券有限责任公司所有,未经书面许可,任何机构和个人不得以任何形式翻版、复制和发布。如引用发布,需注明出处为中邮证券有限责任公司研发部,且不得对本报告进行有悖原意的引用、删节和修改。中邮证券有限责任公司对于本免责申明条款具有修改权和最终解释权。请务必阅读正文之后的免责条款部分 13 公司简介公司简介 中邮证券有限责任公司,2002 年 9 月经中国证券监督管理委员会批准设立,注册资本 40.6 亿元人民币。中邮证券是中国邮政集团公司绝对控股的证券类金融子公司。中邮证券的经营范围包括证券经纪、证券投资咨询、证券投资基金销售、融资融券、代销金融产品、证券资产管理、证券承销与保荐、证券自营和与证券交易、证券投资活动有关的财务顾问等。中邮证券目前已经在北京、陕西、深圳、山东、江苏、四川、江西、湖北、湖南、福建、辽宁、吉林、黑龙江、广东、浙江、贵州、新疆、河南、山西等地设有分支机构。中邮证券紧紧依托中国邮政集团公司雄厚的实力,坚持诚信经营,践行普惠服务,为社会大众提供全方位专业化的证券投、融资服务,帮助客户实现价值增长。中邮证券努力成为客户认同、社会尊重,股东满意,员工自豪的优秀企业。业务简介业务简介 证券经纪业务 公司经中国证监会批准,开展证券经纪业务。业务内容包括:证券的代理买卖;代理证券的还本付息、分红派息;证券代保管、鉴证;代理登记开户;公司为投资者提供现场、自助终端、电话、互联网、手机等多种委托通道。公司开展网上交易业务已经中国证监会核准。公司全面实行客户交易资金第三方存管。目前存管银行有:中国邮政储蓄银行、中国工商银行、中国农业银行、中国银行、中国建设银行、交通银行、民生银行、兴业银行、招商银行、北京银行、华夏银行。证券自营业务 公司经中国证监会批准,开展证券自营业务。使用自有资金和依法筹集的资金,以公司的名义开设证券账户买卖依法公开发行或中国证监会认可的其他有价证券的自营业务。自营业务内容包括权益类投资和固定收益类投资。证券投资咨询业务 公司经中国证监会批准开展证券投资咨询业务。为证券投资者或客户提供证券投资的相关信息、分析、预测或建议。证券投资基金销售业务:公司经中国证监会批准开展证券投资基金销售业务。代理发售各类基金产品,办理基金份额申购、赎回等业务。证券资产管理业务:公司经中国证监会批准开展证券资产管理业务。证券承销与保荐业务:公司经中国证监会批准开展证券承销与保荐业务。财务顾问业务:公司经中国证监会批准开展财务顾问业务。