温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
机器
学习
算法
金融市场
趋势
预测
研究
,基金项目微型电脑应用 年第 卷第期基金项目:榆林市科协青年人才托举项目()作者简介:高霞(),女,硕士研究生,副教授,研究方向为金融。文章编号:()基于机器学习算法的金融市场趋势预测研究高霞(榆林学院,管理学院,陕西,榆林 )摘要:针对当前方法对金融市场长、短期趋势的预测结果偏差较大的问题,提出了基于机器学习的金融市场趋势预测方法。依照一定时间间隔采集金融数据,产生金融数据时间序列,采用小波分析方法对金融数据时间序列进行处理,去除其中的噪声,保留近似数据。通过卷积长短期记忆神经网络对金融数据时间序列进行学习,建立金融市场预测模型。测试结果表明,所提出的方法可以有效清除噪声、平滑初始数据,在短期趋势与长期趋势预测中均具有较高预测精度。关键词:机器学习;金融市场;趋势预测;时间序列;小波分析中图分类号:文献标志码:(,):,:;引言当前我国金融业发展步伐较快,并逐步实现同国际金融接轨。金融市场趋势变化频繁,具有极度复杂性,造成经济显著波动,对投资者与社会经济乃至全球经济产生直接影响。因此需要对当前金融市场的趋势进项分析,研究有效的金融市场趋势预测方法。当前普遍应用的趋势预测方法为基于多维交互验证法的趋势预测方法和基于多类别特征体系的趋势预测方法,前者从心理与行为等维度出发进行分析,构建多维决策树模型实现趋势预测。但该方法只适用于短期趋势预测,在进行长期趋势预测时精度显著下降。后者将金融市场多类别特征体系输入神经网络内进行训练,由此实现趋势预测。但预测过程中忽略金融数据内是噪声,导致神经网络训练时过度关注噪声数据拟合,造成预测模型泛化能力下降,预测结果偏差较大。针对上述问题,提出了基于机器学习算法的金融市场趋势预测方法,针对金融数据时间序列,利用小波分析进行降噪,在此基础上采用机器学习算法中的长短期记忆神经网络准确预测金融市场趋势。机器学习算法的金融市场趋势预测方法 构建金融数据时间序列金融数据是一种具有非线性、非平稳以及高噪声特性的时间序列。金融数据时间序列的构建即依照固定时间间隔采集金融 数 据 样 本,根 据 时 间 顺 序 逐 次 排 列 成 被 观 测 数据。以()和,(为自变量,且)分别 表 示 金 融 数 据 和 采 样 时刻,然后构建 序 列 集 合(),(),()。采用机器学习算法中的卷积长短期记忆神经网络构建预测模型,将(),(),()作为模型输入完成金融市场趋势预测。.小波分析由于(),(),()易受外部因素影响,因此会包含一定噪声,导致(),(),()内存在明显的非线性特征。长短期记忆神经网络可有效处理非线性数据,但容易对噪声数据拟合投入过多,将造成预测模型的泛化能力下降,由此导致预测精度降低。小波分析过程可利用伸缩与平移等运算实现不同尺度数据信号的细化分析,能够在清除(),(),()内噪声的同时最大限度上扩展预测模型储存空间,保存初始数据信息 ,基金项目微型电脑应用 年第 卷第期的特征,减少预测时间。基于此,为减弱噪声扰动对预测模型的影响,提升最终预测精度,可对(),(),()在利用预测模型预测金融市场趋势之前,采用小波分解与重构实施数据预处理,利用小波降噪清除(),(),()内的噪声高频成分。为了减少预测时间,可利用小波分解过程将其划分为两部分:高频数据与低频数据,并针对低频数据持续分解,如图所示。小波分解的描述如式():()式中,表示小波分解的第层低频数据,表示小波分解的第层高频数据。图小波分解过程示意图为了实现数据快速降噪,可依照小波分解的第层低频系数和层高频系数实施 小波重构,并以零描述高频系数。利用小波分解获取的低频系数和高频系数分别描述(),(),()的整体变化趋势和短期随机扰动,减少算法运行时间。基于此,以零描述高频系数既能够快速有效清除噪声,达到平滑信号的目的,还能够获取初始近似数据,以此防止因外部影响因素造成预测模型过度学习的问题,增强预测模型外推能力。.基于卷积长短期记忆神经网络预测模型构建长短期记忆神经网络内的隐藏层均是完全连通的,其能够更好的将语音与文本映射至可训练的向量空间内,但却不能实现最佳的数字数据标记。卷积长短期记忆神经网络可利用卷积核取代完全连通层实现数字数据标记。因此本文利用卷积长短期记忆神经网络构建预测模型。基于卷积长短期记忆神经网络的预测模型内,将小波分解与重组后的(),(),()与对应的前一天、前三天、前七天均值的金融数据共同作为输入,即可获取时序相关性,又能获取空间特征。由此基于卷积长短期记忆神经网络的预测模型可同时获取时间特征与空间特征,同时状态间的转换变为卷积运算。基于卷积长短期记忆神经网络的预测模型中单元信息更新过程如下:()()()()()()()()()()式中,为时间步长下的输入门输出,为时间步长下的单元状态,为时间步长下的输出门输出,为时间步长下的遗忘门输出,为时间步长下隐藏状态,和 分别为 函数和双曲正切函数,和分别表示卷积运算和逐点乘法,为输入门卷积核,为输出门卷积核,为遗忘门卷积核,和分别为偏差矢量和输入门的偏置,和分别为输出门和遗忘门的偏置。基于预测模型获取的时间特征与空间特征,完成金融市场趋势预测。在基于卷积长短期记忆神经网络的预测模型内,参数共享是模型泛化的主要因素,利用数据与核间的卷积运算实现输入数据间共享。因此针对在数据内获取泛化特征的过程更适于利用卷积操作实现。但考虑金融市场中交易数据的特性,无法直接利用基于卷积长短期记忆神经网络单位的初始设计。金融市场中的交易数据虽然能够构建二维框架,但其中含有开盘价、收盘价、上限价、下限价以及交易量等不同类型的特征,因此无法利用卷积长短期记忆神经网络内的二维卷积。基于上述分析,基于卷积长短期记忆神经网络的预测模型内采用一维卷积的优化方法,通道的移动过程仅在二维数据帧的时间线列发生,移动过程始终保持在水平方向,并且通道在类型有所差异的金融数据间同样能够实现共享,以此保障参数的共享性。基于卷积长短期记忆神经网络的预测模型设计过程中,卷积过程内数据帧大小不变,即若输入的和输出通道分别为和,那么为,同时其被视为矢量充当后续分类器层的输入。具体应用实例测试应用测试的目的主要为测试本文所研究的基于机器学习算法的金融市场趋势预测方法在实际金融市场趋势预测中的应用效果。以阿里巴巴为研究对象,在网址 :(英为财情网站)下载本文方法应用测试所需的初始数据,选取 年 月 日至 年月 日内的初始数据作为确定预测模型参数的训练集合;将 年 月 日至 年月 日内的初始数据用于判断预测模型预测能力的测试集合。根据所采集的数据,利用本文方法预测研究对象金融市场趋势,所得结果如下。指标选取与参数确定参考相关文献结合所采集的初始数据,确定收盘价、开盘价、最高价、最低价、日平均成交量、日平均成交量、日平均成交量、指数平滑移动平均线、动向指标以及相对强弱指数这 个指标为特征输入向量,提取影响研究对象金融市场趋势变化的深层特征描述,实现研究对象金融市场趋势预测。预测模型中,激活函数的确定能够使模型学习金融数据内的非线性因素,并对模型训练过程产生重要影响。因此本文选用 函数为激活函数,该函数的主要优势为收敛速度较快,可提升预测效率。模型训练过程中选用 算法为优化算法,同时在设定惩罚项的基础上,采用 方式随机删除部分隐藏单元,以此防止出现预测模型拟合过度问题。小波分析应用测试根据所采集的研究对象初始金融数据构建初始收盘价时间序列,利用本文方法中的小波分析将初始收盘价时间序列分解为层,以此重构初始收盘价时间序列,提升后续预测模型泛化能力。图所示为研究对象初始收盘价走势与重构后的收盘价走势对比图。分析图能够得到,采用本文方法中的小波分析对研究对象初始收盘价时间序列进行重构后,扩展了数据存储空间,能够减少平滑初始数据的时间,达到有效清除噪声的目的,同时还能够最大程度保留近似数据。由此说明利用重构后的收盘价时间序列进行趋势预测 ,基金项目微型电脑应用 年第 卷第期是有效的。图原始收盘价与重构后收盘价趋势图 预测效果测试利用本文的预测模型,分别基于初始收盘价时间序列和重构后的收盘价时间序列进行收盘价趋势预测,并将预测结果与实际趋势变化情况进行对比,结果如图所示。分析图得到,在训练集内,利用本文模型对于初始收盘价时间序列与重构后的收盘价时间序列进行训练,均可获取较准确的预测结果。测试结果表明本文方法能够有效进行趋势预测,且利用小波分析重构金融数据时间序列能够提升预测模型的泛化能力,令预测精度有所提升。()训练集()测试集图本文方法预测结果 预测效果对比选取文献 基于多维交互验证法的趋势预测方法和文献 基于多类别特征体系的的趋势预测方法为对比方法。以平均绝对误差与 不相等系数为对比指标,分别对比本文方法与对比方法的预测效果,以此进一步验证本文方法的预测性能。两个指标计算公式为()()()()()式中,和分别表示实际值与预测值。的取值范围为,其值越小说明预测值与实际值拟合度越高,即预测结果精度越高。的取值范围为,其值越小说明预测结果精度越高。分析图()得到,在短期趋势预测中,三种方法预测结果的对比指标差异并不显著,本文方法的预测效果略优于两种对比方法,文献 方法预测结果对比指标值最高,说明该方法在短期趋势预测中预测精度最差。分析图()得到,在长期趋势预测中,三种方法预测结果的对比指标值均呈现不同程度的上升趋势,其中本文方法对比指标值上升幅度最小,文献 方法对比指标值上升幅度最大,显著高于文献 方法,说明该方法在长期趋势预测汇总预测精度最差。综合分析可知本文方法具有较高的预测精度,且适用于不同时间跨度的趋势预测。()短期预测()长期预测图预测效果对比结果总结准确的金融市场趋势预测能够帮助投资者做出正确决策,有利于金融稳定,为此本文研究基于机器学习算法的金融市场趋势预测方法。经过应用测试,验证了本文方法的应用效果。本文的成果充分说明在金融市场趋势预测研究领域中引入机器学习算法具有显著可行性。这些成果对于金融市场趋势预测研究产生一定借鉴作用。参考文献林仁文,杨熠中国股票市场的趋势预测:基于多维交互验证法上海对外经贸大学学报,():(下转第 页),基金项目微型电脑应用 年第 卷第期图并行模式下数据聚类耗时统计图为了验证本研究设计的利用用电数据对企业信用进行评价方案的可靠性,评级准确度结果如图所示。图中,实线表示为利用用电数据进行企业信用评级的准确率,虚线表示为利用数据包络进行企业信用评级的准确率。通过图像可以得知本研究设计信用评级方案的准确率在 以上、平均准确率达到;采用数据包络方案进行信用评级的准确率平均在,所以本研究设计的评级方案有更高的准确率。图企业信用评级准确率总结本研究通过对企业的用电数据进行分析,将单机模式和包含不同分布式节点数量的模型对不同数据量的数据进行处理,可以得出节点越多,算法运行效率越高。通过将 年用电数据的评级结果、数据包络方案的评级结果与该年年末的财务报表中的企业信用评级进行比较,可以得知本研究设计信用评级方案的准确率在 以上、平均准确率达到,具有较大的实用价值。参考文献王海兵,周彬 内部控制、审计意见与企业信用评级 重庆 理 工 大 学 学 报(社 会 科 学),():徐丹 构 建 电 力 企 业信用 评 价 体 系 大 众 用 电,():楼裕胜公共信用信息环境下的企业信用评价研究统计与信息论坛,():王建琼,陈冲高管连锁网络对企业信用评级的影响研究:基于股上市公司的经验分析工业技术经济,():周茜,谢雪梅,吕淼虹众筹模式下小微企业信用风险测度与评级转移模型模糊系统与数学,():陈洪海,王慧,隋新基于信息解释能力的小企业信用评级体系构建研究系统工程学报,():翟玲玲,吴育辉信用评级的融资与监督效应:来自企业并购的证据南开管理评论,():周颖基于信息增益的小型工业企业信用评级模型运筹与管理,():王彦,陆海,杨洋,等基于数据融合算法的电网用电量数据分析方法节能技术,():刘明红,袁昕,童辉高维电力数据的聚类优化算法的研究科技通报,():,():(收稿日期:)(上接第)王婷,夏阳雨新,陈铁明基于多类别特征体系的股票短期