温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
LSTM
神经网络
股票价格
预测
云南民族大学学报(自然科学版),():收稿日期:作者简介:李丽萍(),女,硕士研究生 主要研究方向为经济统计通信作者:江绍萍(),女,博士,教授 主要研究方向为应用统计基于 神经网络的股票价格预测李丽萍,曾丽芳,江绍萍,何文倩(云南民族大学 数学与计算机科学学院,云南 昆明 )摘要:针对传统的时间序列方法和传统的机器学习算法对股票价格预测的精度较低这一问题,鉴于股票数据的非线性、非平稳性以及序列间的相关性,建立了 神经网络预测模型,以云南旅游股票历史交易数据为输入,对云南旅游股票的收盘价进行预测,并求解基于各预测模型下的统计指标 ,且与其他两种模型的预测结果进行比较 结果表明,神经网络预测模型比其他 种(、)神经网络预测模型的预测误差更小,结果更为准确,预测值更接近于股票价格的真实值关键词:股票价格;神经网络;云南旅游股票;预测中图分类号:文献标志码:文章编号:()股票是一种重要的投资方式,它的价格走势是人们乃至国家都非常关注的焦点 然而,股票的价格走势是复杂多变的,想要准确预测股票的价格走势并非易事 所以,如何更加有效的预测股票价格是当下国内外研究学者们研究的热门话题,也是投资者们迫切想知道的奥秘 对于投资者而言,找到一个能准确预测股票价格的方法至关重要,因为预测结果越准确,投资者的投资风险就越低,收益就越大目前已有很多预测股票价格的方法,如传统时间序列方法,模型,模型,模型等 但在实际研究中,大部分股票价格走势呈现非线性趋势,此时采用传统的方法预测股票价格很难准确描述股票的价格走势 然而,随着信息技术的发展和机器学习理论的不断进步,涌现出很多基于机器学习和深度学习的方法来对股票价格进行预测 例如支持向量机法、和 神经网络等机器学习方法 有很多学者同时采用 模型和 神经网络这两种方法对股票收盘价进行预测 结果表明,无论是短期、中期还是长期预测,神经网络的预测结果都优于 模型;该方法很好的解决了股票数据非线性这个问题,弥补了传统时间序列方法在处理非线性数据时的不足;但在处理股票数据的时序相关性时还是存在局限性 而深度学习的方法长短期记忆神经网络()能更好的处理与金融时间序列高度相关的问题,且在处理具有非线性趋势和序列相关性的数据问题上,可以达到更高的精度 ,这也就解决了传统机器学习算法在处理股票数据的时序相关性时存在的局限性并且,近年来,长短期记忆神经网络()已经被应用于很多领域来解决分类和预测等问题,也有很多研究者把长短期记忆神经网络()应用于时间序列数据的预测,并且得到相比之前方法更高的准确率 因此,本文利用长短期记忆神经网 络()能够更有效获取股票历史交易数据时间序列特性的能力,建立了 神经网络预测模型,并与其他 种模型的预测结果进行比较,突出 预测模型捕获数据时序结构的独特优势 模型原理和方法 人工神经网络模型原理 神经网络(反向传播神经网络)是由 和 于 年提出,其基本原理是根据误差反向训练模型,利用随机梯度下降算法实现对模型各个层级连接权值的动态调整,从而使得预测输出无限逼近期望输出 ;其模型结构一般分为 层,包括:输入层、输出层以及隐藏层 具体结构如下图 所示图 神经网络结构图图 中,代表神经网络的输入向量,表示为(,);代表神经网络的输出向量,表示为 (,);代表他们之间隐藏层的个数;,代表相应的连接权值 神经网络算法的公式如下 ()(),()()(),()式中,为对应神经元的输入;为对应神经元的输出;为相应的连接权值;为相应的阈值 神经网络模型原理 神经网络是一种典型的反馈型神经网络,它基于 神经网络的基本结构,在隐藏层中增加一个承接层(承接层的作用是状态反馈),其作用是把的 时刻(大于)的信息储存下来,并与 时刻的信息共同输入至隐藏层中;对非线性映射的逼近能力优于 神经网络,并可以快速优化问题的求解;其模型结构一般分为 层,包括:输入层、隐藏层、承接层和输出层 其表达式为()()()所示:()(),()()()(),()()(),()式中,()代表神经网络的输入值;()、()、()代表神经网络的输出值;代表时刻值;下标 表示该神经网络有一个或者多个隐藏层;、表示相应的连接权值;而 和 分别对应神经元的传递函数 长短期记忆神经网络长短期记忆神经网络(,)是一种特殊的递归神经网络,是循环神经网络()的一种变体 它通过在适当的位置添加“门”结构来解决信息冗余的问题;在流经神经元时,允许信息被选择性的保留或遗弃,从而增强了原始信息的权重,并削弱了不相关信息的权重,解决了传统递归神经网络中梯度消失、梯度爆炸、无法处理长期依赖等问题 神经网络结构图如图 所示图 神经网络结构图根据 的结构,每个 单元工作的公式描述如下 :()判定为无用或不相关的那些历史信息将被遗忘门抛弃,如式()所示 (,)()()将上一时刻保留的信息与此刻的输入信息共同作为输入门的更新状态,如式()()所示 (,),()()()由输出门输出当前时刻的状态信息,如式()()所示 (,),()(,)(),()式中,和 为相应的连接权值,与 为相应的偏置,对应 时刻遗忘门的激活值,为 函数,对应 时刻的细胞状态更新值,对应当前神经单元的输出值 实证分析 数据集来源与预处理本文进行实验的数据集是从同花顺 上下载的云南旅游股票历史交易数据,该数据集选取开盘价()、最高价()和最低价()等 个指标,把它们重新命名为 个变量,并以矩阵的形第 期李丽萍,曾丽芳,江绍萍,等:基于 神经网络的股票价格预测式作为实验的输入来进行实验 ,如表 所示 文中选取了 年 月 日至 年 月 日之间共计 的股票数据 主要是运用前一天的股票历史交易数据来对第二天的收盘价进行预测表 实验指标指标名称指标描述变量指标名称指标描述变量指标名称指标描述变量 开盘价 涨幅 换手率 最高价 振幅 成交次数 最低价 总手 收盘价 成交额在进行实验前,首先对数据进行预处理 本次实验,将数据集以 的标准划分为训练集和测试集 把数据集输入后,先对数据进行归一化处理,并检查是否存在异常值和缺失值;上述步骤完成以后才能进行下一步 本次实验的数据集经检验并不存在异常值和缺失值,所以只需要对数据进行归一化处理 数据的归一化可以使得所有数据的度量单位统一,并且有利于提高模型的精度 进行归一化的公式如()式所示 珋 ()(),()式中,为第 个变量;珋 为 的均值;()、()分别表示 的最大值和最小值本文选取 和 以及模型的学习时间和收敛速度作为 种神经网络预测模型性能的评价指标 其中,、的表达式分别如下所示:平均绝对误差为 ,()均方根误差为 ()槡,()式中,为测试数据集的大小;表示股价的第 个真实值;表示模型的第 个预测值 实验流程本文云南旅游股票数据预测的流程如图 所示图 神经网络模型训练流程图 实验结果及分析 实验环境对于此次实验,实验环境的硬件配置是 核的 ()()()、和 为 的笔记本电脑,实验平台为 本文优化器采用 ()模型参数设置本文主要对模型的隐藏层数,学习速率和最大训练次数这 个参数进行调参首先是隐藏层的设置 种神经网络的隐藏层单元个数的范围可依据经验公式计算得出:槡 ,()式中:为隐藏层数,为输入层数,为输出层数,为 之间的常数 实验中,的取值范围是 ,根据公式()计算得到隐藏层的层数范围在 对于隐藏层具体取多少,在保证 和 的取值不变时,让 分别取 间整数值进行模拟验证 经过多次实验验证,种神经网络的隐藏层单元个数都是从 开始误差就一直呈下降趋势 其中,和 这 种神经网络的隐藏层数为 时 ,值达到最小,从隐藏层数为 时误差就一直呈上升趋势;而 神经网络的隐藏层数为 时 ,值达到最小,从隐藏层数为 时误差就一直呈上升趋势 所以,综上所述:当 和 这 种神经网络的隐藏层数为 ,神经网络的隐藏层数为 时,各神经网络 ,值最低,预测结果更为准确 为了更加清楚的看出 ,的值从大到小再上升的变化情况,这里展现了种神经网络隐藏层数为 时,它们的 和 的值,具体数据见表 而学习速率则根据一定的规律调试程序选择各个神经网络最合适的数值,发现 种神经网络模型的学习速率都为 时,模型的预测效果最好 和 这 种神经网络在最大训练次数为 时就达到目标精度,而 神经网络则要在最大训练次数为 时才能达到目标精度 、和 种模型的隐藏层数和最大训练次数的参数设置如表 所示云南民族大学学报(自然科学版)第 卷表 预测模型参数及误差隐藏层数 神经网络 神经网络 神经网络 表 参数设置模型隐藏层数最大训练次数 神经网络 神经网络 神经网络 并且,在本次实验中,、和 种神经网络模型的输入层和输出层节点数均相同,分别为 和 而像权值,阈值这等这些参数则由程序在一定范围内随机产生 模型比较从图 可以看出,、神经网络预测模型的预测结果与股票真实值虽然走向趋势大致一致,但是还是存在明显的偏差 相反,神经网络预测模型的预测结果与股票真实值除了前几天存在偏差,后面的拟合效果都很好 所以得出结论,神经网络比其他 种模型的预测结果更为准确 从图 可以直观的看出 神经网络预测模型的预测值与股票价格真实值是最贴合的,且预测值与股票价格真实值之间误差最小 、和 种模型的预测误差图如图 所示,图形显示了各个神经网络模型的预测值与真实值的偏差,预测误差的表达式如下所示,()式中,表示股价的第 个真实值;表示模型的第 个预测值 图中可以直观的看出 和 预测模型的预测误差曲线在零轴上下大幅浮动,与零轴有明显的偏差,可知 和 模型的预测值与真实值之间有较大的差距 而 预测模型的预测误差曲线可以看出除了前几天,后面的值基本在零轴上下轻微浮动,并且后期基本趋于一条直线并接近于零 这说明 神经网络预测模型比其他两种神经网络预测模型的精度高 5.t E&M N B O M-4 5.M#1 M5.,图 各神经网络模型在测试集上的预测值图 各模型预测误差图在输入变量以及输出变量一致的情况下,神经网络的学习时间明显比其他两种预测模型长,甚至是 神经网络的好几倍 这是因为 为了能更好的处理时间序列数据,除了有空间结构外,还有时序结构 所以,神经网络在训练过程中需要更新较多的参数,增加了训练时间,导致运行速度相对较慢,这点我们从表 中各神经网络的学习时间这个指标可以直观的看出表 各模型预测评价指标预测模型 学习时间收敛速度准确度 神经网络 快 神经网络 较快 神经网络 慢 第 期李丽萍,曾丽芳,江绍萍,等:基于 神经网络的股票价格预测同样,从表 可以看出,神经网络模型的 和 值显然比其他 种模型的小,分别为:、,表明预测结果更为准确,从而再次说明 神经网络对该样本的预测效果确实相较于其他 种神经网络更好 结语由于股票价格非线性、信噪比低不易分离、非平稳的特性,导致一些传统的预测方法预测精度都不高 然而,近年来,已经应用于很多领域来解决分类和预测等问题,其中也包括金融领域,比如股票收盘价的预测 所以有很多学者把 神经网络应用于时间序列数据的预测,并且得到相比之前方法更高的准确率 现在,把 运用于预测股票价格的问题上,并于其他 种预测模型作比较,进一步说明 在处理时序数据方面的独特优势 由上述分析可知,神经网络预测模型的 和 比其他 种模型更小,预测结果更为准确 所以,结果表明,神经网络对该样本的预测效果确实相较于其他 种神经网络更好参考文献:,():何树红,吴迪,张月秋 比较 神经网络和 神经网络在基金净值预测中的应用 云南民族大学学报(自然科学版),():崔文?,李宝毅,于德胜 基于 模型和 神经网络模型的股票价格预测实证分析 天津师范大学学报(自然科学版),():,:,李莉,杜丽霞,张子柯 基于多变量 神经网络的澳大利亚大火预测研究 电子科技大学学报,():王东,王霄鹏,杨川东 一种基于主成分 模型在股票预测中的研究 重庆理工大学学报(自然科学版),():李振国,徐建新 融合 神经网络与 的交通拥堵指数预测 软件导刊,():秦喜文,王强进,王新民,等 基于 和 方法的北京市 ()短期预测 吉林大学学报(地球科学版),():黄超斌,程希明基于 神经网络的股票价格预测研究 北京信息科技大学学报(自然科学版),():杨向前,欧阳鹏 基于 和 的金融时间序列预测 ,():,:黄伟建,李永涛,黄远 基于混合神经网络和注意力机制的混沌时间序列预测 物理学报,():,:,(,):,(,),:;(责任编辑杨柱元)云南民族大学学报(自然科学版)第 卷