长春理工大学学报(自然科学版)
Journal of Changchun University of Science and Technology (Natural Science Edition )
Vol.44No.2Apr.2021
第44卷第2期2021年4月
收稿日期:2019-11-22
基金项目:国家自然科学基金(11601039);吉林省自然科学基金(20140101199JC )作者简介:刘璐(1994-),女,硕士研究生,E-mail :**********************通讯作者:施三支(1968-)女,博士,教授,E-mail :**************
基于LSTM 的COMEX 黄金期货价格预测对比研究
刘璐,娄磊,刘先俊,施三支
(长春理工大学
理学院,长春
130022)
摘要:黄金期货价格时间序列具有复杂性、随机性和非平稳性的特点,而这三个特点是传统模型无法完全描述的,
因此传统模型的预测效果不佳。利用神经网络方法进行深度学习,并建立多层LSTM 及双向LSTM 模型预测未来黄金期货的价格及其发展变化的规律和趋势,并且在相同数据的情况下与ARIMA 模型、RNN 模型、SVR 模型进行了对比实验。结果表明,在四个评价指标下,双向LSTM 模型优于所有对比度模型,取得了较好的预测效果。同时,双向LSTM 模型的运行时间更短。因此,双向LSTM 模型是一种更有效的黄金期货价格预测方法关键词:黄金期货价格预测;神经网络;深度学习;双向LSTM 中图分类号:O212.1九月份星座
文献标志码:A
文章编号:1672-9870(2021)02-0129-07
A Comparative Study of Comex Gold Futures
Price Forecast Bad on LSTM
LIU Lu ,LOU Lei ,LIU Xian-jun ,SHI San-zhi
(School of Science ,Changchun University of Science and Technology ,Changchun 130022)
Abstract :The gold price time ries has the characteristics of complexity ,randomness and non-stationarity ,which cannot be fully described by the traditional model ,so the prediction effect of the traditional model is not good.In this paper ,the neu-ral network method is ud for in-depth learning ;and the multi-layer LSTM and two-way LSTM models are established to predict the future price of gold futures ;as well as the law and trend of its development and change.Compared with ARI-MA model ,RNN model and SVR model under the same data ,the results show that under the four evaluation indexes ,the bidirectional LSTM model surpass all the contrast modelsand achieves better prediction effect.At the same time ,the op-eration time of the bidirectional LSTM model is shorter.Therefore ,the bidirectional LSTM model is a more effective pre-diction method for gold futures price.
Key words :gold futures price forecasting ;neural network ;deep learning ;bidirectional LSTM
黄金期货市场在金融市场有着十分重要的位置,因此其预测问题也被视为重点问题。在预测方法上可分成传统预测模型和非线性预测模型。传统预测模型包含ARIMA 模型(移动平均自回归模型)、GARCH 模型(自回归条件异方
动物名字
差模型)、指数平滑模型等,并在黄金价格预测研究上取得了很大进步。比如在2014年,Sharma A M 和Baby S [1]运用ARIMA 模型对印度的黄金价格进行预测分析。同时,诸多学者也利用ARIMA 模型对纽约商品交易所、伦敦国际金融
长春理工大学学报(自然科学版)2021年
期货交易所、上海期货交易所等具有明显交易特点的黄金或黄金期货交易数据进行建模预测[2-3]。在此基础之上,一部分研究者运用了ARIMA-GARCH模型,对黄金价格进行了研究与分析[4-7]。比如潘贵豪等人[6]选用ARMA-GARCH 模型对黄金价格的动态演化过程进行了实证阐述,黄金价格数据的生成的动态变化过程可以被该模型精确的刻画表明,平均误差较小。传统预测模型的各项研究均证明了其在预测黄金价格的走势或动态特征方面是有效的,但是,鉴于黄金期货价格时间序列具有非线性及高噪声的数据特征,对其精确预测依旧十分困难,同时由于时间的动态变化,使得自变量和因变量二者之间的关系也会随之发生变动,因此传统时间序列模型很难精准得对黄金期货市场进行预测。
近年来,随着计算机硬件水平提升得越来越快,对神经网络的研究也逐渐深入,由此非线性模型逐渐取代了时间序列模型在黄金期货预测方面的应用,非线性预测模型包括基于ANN模型(人工神经网络模型)及其演化的各种模型,如BPNN、SVR模型(支持向量回归模型)、DNN 模型(深层神经网络
模型)及其演化的各种模型,如CNN、RNN等。2010年曾濂等人[7]提出了一种基于BP神经网络的改进模型,研究首先使用定性分析找到伦敦黄金期货价格变动的影响因素,然后利用投影寻踪方法筛选出非线性因素中影响力最大的因素输入神经网络,并改进算法进行网络学习,最后训练得出所需的BPNN[8]。基于浅层神经网络对黄金期货价格及趋势进行预测的研究较之深层神经网络的要多,包括ANN模型[9]、基于GA-BP神经网络[10-12]、RBF神经网络[13]、广义回归神经网络[14-15]和SVR模型[16-17]等等。
近年来,LSTM模型(长短期记忆网络模型)开始逐步应用在金融序列预测问题上,众多研究者开始利用LSTM模型对股票市场进行建模预测,2015年,Chen等人[17]将其运用于我国股票市场的股价预测,相较于其他预测模型,LSTM的预
测效果得到了大幅提升。多个应用LSTM模型的
金融序列预测,都获得了更佳的预测效果[18-20],
但目前应用在黄金期货市场预测上的研究成果
相对较少。
综上所述,为了寻找一种更合适的黄金期货
价格预测方法,建立了多层及双向LSTM预测模
型。以COMEX黄金期货价格序列为研究对象,
先将原始黄金期货价格序列进行归一化处理,
然后进行不同参数下模型的比较,最后,选择出
最适应归一化数值下的参数模型,输出预测的
结果。结果表明,双向LSTM模型预测精度得到
骨碎补的功效与作用了明显的进步,也验证了模型的有效性。
1基于LSTM的预测模型
传统的黄金期货价格预测模型不能充分描
述黄金期货价格很强的非线性、非平稳性和高
噪声的特点,因此在预测问题上存在许多困难,
而神经网络能够发现并刻画数据自身复杂的内
部结构特征,也能自适应得学习和构建数据的
非线性的复杂关系,不会对输入变量施加限制,
也具备更好的迁移学习(transfer learning)性质,
因此非常适合处理如黄金期货价格这样的金融
数据。其中LSTM模型更是经由丢弃和保留的机
制有效解决了梯度反传进程中产生的梯度消失
(vanishing gradient problem)与梯度爆炸(explod⁃ing gradient problem)问题。由于LSTM能够对信息进行全局化处理,因此其更适合于处理和预
测时间序列。因此,本文建立了一个基于LSTM
的双向网络预测模型,该模型仅基于相关黄金
期货价格的时间序列数据,不考虑其他影响因
脚心长水泡
素,因此有效地消除了数据输入变量和模型参
数的不确定性。
1.1LSTM模型基本原理
LSTM网络模型最早由Hochreiter和Schmidhu⁃ber(1997)[20]提出。LSTM每一个神经元的结构如图1所示,其内部包括一个细胞状态(Cell)和三个门控(Gates)设置,细胞状态(Cell)记录神经元状态,综合隐藏和时间步的事件,通常是经由
130
三种门控机制实现这类记忆方式,即输入门(Input Gate )、遗忘门(Forget Gate )和输出门(Out⁃put Gate )。输入门和输出门用来接收、输出和修正参数,遗忘门用来决定上一单元状态信息的
保留程度。
图1LSTM 单个神经元结构图
图1中h t 、
X t 、tanh 和σ分别表示t 时刻细胞的输出状态值、t 时刻细胞的输入状态值、双曲正切函数前馈网络层和sigmoid 函数前馈网络层, 表示点乘,
表示向量拼接。经由拼接向量乘上权重矩阵之后,再经由激活函数转换来作为一种门控状态。下面介绍各个门控的计算原理及过程。
首先计算t 时刻下遗忘门(Forget Gate )的激活值f t ,公式如下:
f t =σ(W f ⊛(X t ,h t -1)+b i )
(1)
其次计算t 时刻下输入门(Input Gate )
i t 的值和输入细胞的候选状态(Cell )C t 的值,公式如下:
i t =σ(W i ⊛(X t ,h t -1)+b i )
(2)C t =σσ(W i ⊛(X t ,h t -1)+b i )(3)
由以上计算可以得到t 时刻下的细胞状态(Cell )的更新值C t ,公式如下:
C t =f t ⊛C t -1+i t ⊛C t
(4)
在计算得到细胞状态(Cell )更新值后,最后就可以计算输出门(Output Gate )的值,其计算公式如下:
O t =σ(W O ⊛(X t ,h t -1)+b O )
接球手(5)h t =O t ⊛tanh (C t )
(6)
通过以上的计算,LSTM 就可以确定最终的输出值。1.2
多层LSTM 与双向LSTM 模型构建及结构在Windows10操作系统下搭建Python 的keras 框架。keras 包含两种模型,一种是Sequential 模型,另一种是Model 模型,本实验选用Model 模型来搭建多层的LSTM 网络模型以及双向LSTM 模型分别对数据进行分析预测。
多层LSTM 模型是将单层细胞状态(Cell )进行堆叠,把每层神经元的个数都藏到Cell 中间,其优点是可以更抽象的表达模型特征,并且按
照数据特征,有效改善预测效果,但并非绝对的。有时针对简单的数据,多层LSTM 的预测效果反而会因为过拟合而降低准确率。多层LSTM 不是定义一个基础细胞状态之后屡次调用,而是每次都界定一个新的基础细胞状态。也就是说,前一层的LSTM 的输出就是后一层的输入,即输入数据整体上是一个时间序列,而对每个内层特征数据来说,输入数据也是一个时间序列及二维数组,因此也可以称为数组的数组。举一个简单的例子:一个双层LSTM 模型,第一层的隐藏神经元个数是128,第二层的隐藏神经元个数为64,在t 时刻的输入向量是一维的。那么经过第一层的计算以及Cell 的操作,第一层的输出就会变成128维。叠加第二层LSTM 后,此时第二层的t 时刻的输入即为128维,同样的道理,经过运算其输出为64维。最后经过Cell 的操作,最终的输出维度变为一维。
双向LSTM 模型是隐藏层要保留两个值,C 参与正向计算,
C ′参与反向计算。对于每个时刻t ,输入向量会同时赋值于两个方向的LSTM 并进
行计算,这两个单向LSTM 同时影响着最后的输出。在正向计算时,前馈层的h t 与h t -1有关;而反向计算时,反馈层的h t 则与h t +1有关。
多层LSTM 网络模型以及双向单层LSTM 模型的结构如图2、图3所示。
刘璐,等:基于LSTM 的COMEX 黄金期货价格预测对比研究
第2期131
长春理工大学学报(自然科学版)2021
年
图2
三层LSTM
神经网络结构
图3双向单层LSTM 神经网络结构
贱的英文
2实证分析
所有数据均来源于相关财经网站,由于2008
年全球性金融危机对金融市场产生了非常大的影响,使得金融市场发生了很大的震荡,因此2008年以前的数据研究意义较差,本文选取的数据范围为2009年1月1日到2018年12月31
日,共10年2698个数据。
数据选取的是纽约商品交易所COMEX 分部的黄金期货数据,由于世界黄金期货市场中,纽约商品交易所(COMEX )的黄金期货指数发展较为成熟,同时美国财政部以及国际货币基金组织(IMF )也在此处进行相关买卖交易,是以COMEX 的交易量占全球主导位置,也经常主导全球金价的走向,所以本文选择COMEX 黄金期货价格数据作为研究对象。2.1
数据预处理及模型的评价指标
为避免LSTM 对输入数据的限制,同时也有利于提高模型性能,加快训练网络的收敛性,在对序列进行量化分析前,首先将数据进行归一化处理。根据选取数据的特点和LSTM 的要求,本文采用线性函数归一化方法对数据进行预处
理。公式如下:
x ′i =
x i -min x i
max x i -min x i
(7)
其中,x i 代表第i 个变量;min x i 、max x i 分别代表x i 的最小值与最大值。
对于黄金期货价格这类数据规模及范围不是非常大的情况,实验模型的预测性能评价指
标采用均方根误差(RMSE )、平均绝对误差(MAE )、平均误差百分比(MAPE )、拟合度(R 2)对实验结果进行对比。其中RMSE 、MAE 、MAPE 、R 2的计算公式如下:
MAE =
1N
×∑i =1N
||y i -y i (8)MAPE =1N ×∑i =1N |||
|||||y i -y i y i ×100%
(9)RMSE =
(10)R 2
=1-∑(y -y )
2∑(y -y
ˉ)2
(11)
其中y i 、
y i 分别代表实际值与预测值,N 代表预测窗宽.2.2
实验数据及超参数设置
模型初步建立后,为了使模型更加适合本数据,首先对单层模型进行了模型内部的参数优化。为了确定最合适的数据量,本文将数据分成了6组(分别是近5年、6年、7年、8年、9年和10年)在数据按上述方式确定数据特征及标签后,在测试集均为2019年上半年的数据的情况下(2019.01.01-2019.06.3
0),当训练集年限为9年(即2068个数据)时,模型在测试集上的预测效果最佳。因此本文将2010年至2018年的数据作为TrainSet (训练集),2019年1-6月的数据作为TestSet (测试集),负责训练模型的召回率和正确率,最后训练集据按9∶1的比例划分,最后10%
的数据作为ValidationSet (验证集),负责调整模型相应的超参数以及模型的过拟合现象。实验用数据集划分如表1所示。
132
表1数据集实验数据划分
集合分类TrainSet(训练集)TestSet(测试集)ValidationSet(验证集)数据量2068 128 200
对实验参数进行选择,在不同神经元个数的情况下在训练集和测试集上进行预测,当单向单层LSTM模型的神经元个数为128时,模型在测试集上的预测效果最佳;在不同迭代次数的情况下对在训练集和测试集上进行预测,当次数为500时,模型在测试集上的预测效果最佳;激活函数则同时选取了tanh及relu函数以缓解梯度消失问题;在不同训练步长的情况下,训练步长为3时,模型在测试集上的预测效果最佳;神经网络优化算法使用Adam来更新参数,并应用dropout机制来规避实验的过拟合.表2是实验所用参数的具体说明。
表2实验参数
模型
单向双层LSTM模型双向单层LSTM模型所有模型通用参数
参数名称
神经元个数
激活函数
神经元个数
激活函数
时间步长
Dropout
李仁义Batch size
Epochs
第1层
第2层
第1层
第2层
前向层
后馈层
具体数值
128
64
relu
tanh
128
128
tanh
3
0.2
300
500
2.3模型性能评价与结果比较
本文中采用ARIMA模型、RNN模型、SVR模型、双层LSTM模型、双向单层LSTM模型来进行对比实验,通过比较测试集上MSE、RMSE、MAE、R2的值来进行优劣评判。同时实验还在各个模型中嵌入了回调参数(totaltime),以计算不同模型下数据预测运行的时间。实验对比结果如图4所示,并将对
bezier比结果进行了整理,如表3
所示。
(a)ARIMA
模型
(b)RNN
模型
(c)SVR
模型(d)双层LSTM
模型
(e)双向LSTM模型图4各模型预测结果
刘璐,等:基于LSTM的COMEX黄金期货价格预测对比研究
第2期133