金金工点评2019年03月17日数据异常值处理:比较与实践金融工程投资要点:数据异常值处理:比较与实践在进行回归分析或因子相关性分析时,因子暴露的异常值可能会极大影响回归系数和数据的相关系数。常用的异常值处理方法有均值标准差修正法、固定比率修正法、中位数去极值法、BeatG.Briner方法、因子排序值标准化法、箱形图法和无量纲处理方法,这些方法各有优劣。相较于价量因子,财务数据特别是增长率类数据所含的异常值更多。经实证检验,对于各类数据而言,中位数去极值法和箱形图法是更为稳健的方法。相较于传统的OLS回归法,基于分位数回归的方法更不容易受极端值影响,且能够更为全面地描述被解释变量条件分布的全貌。市场风格解析整体来讲,在过去的一个月中,高Beta、高波动的股票能够获得相对较高的收益,而大规模、前期涨幅过高的股票后市走势将会出现更为明显的回撤。指数风险预测所有样本指数在未来一个月的年化波动区间在21%-31%之间,相较上周出现小幅攀升,财通金工特别提醒投资者注意当前市场的波动情况。指数成分收益归因上周市场风格并不明朗,在表现占优的三只指数中,有以大盘、价值为代表的380价值指数,也有以中小盘、成长为代表的中证800指数,而在表现较差的三只指数中,有以大盘为代表的超大盘指数,也有以小盘为代表的创业板指数。风险提示:本报告统计结果基于历史数据,过去数据不代表未来,市场风格变化可能导致模型失效。财通证券研究所“拾穗”多因子系列报告(第5期)请阅读最后一页的重要声明以才聚财,财通天下证券研究报告联系信息陶勤英分析师SAC证书编号:S0160517100002taoqy@ctsec.com021-68592393张宇联系人zhangyu1@ctsec.com176216888421021-68592220相关报告【1】“星火”多因子系列(一):《Barra模型初探:A股市场风格解析》【2】“星火”多因子系列(二):《Barra模型进阶:多因子模型风险预测》【3】“星火”多因子系列(三):《Barra模型深化:纯因子组合构建》【4】“拾穗”多因子系列(一):《带约束的加权最小二乘:一种解析解法》【5】“拾穗”多因子系列(二):《你看到的不一定是你所想的:解密R方》【6】“拾穗”多因子系列(三):《行业因子选取:中信一级还是申万一级?》【7】“拾穗”多因子系列(四):《总市值、流通市值、自由流通市值:谈谈取舍》谨请参阅尾页重要声明及财通证券股票和行业评级标准2证券研究报告金工点评内容目录1、数据异常值处理的常用...