2024年2月15日发(作者:中国移动面试)
第47卷第3期Vol.47
No.3•人工智能与模式识别・计算机工程2021
年
3
月Computer
Engineering文章编号:1000-3428
(2021)
03-0053-09文献标志码:AMarch
2021中图分类号:TP301.6基于SVD和ARIMA的时空序列分解与预测杨立宁,李艳婷(上海交通大学机械与动力工程学院,上海200240)摘要:针对传统时空序列建模过程中估计空间权重矩阵时难度较高的问题,提出一种基于奇异值分解(SVD)的
时空序列分解模型ST-SVDo对原始时空序列矩阵进行平稳性检测并中心化为零均值平稳时空序列,在假设时间
和空间没有交互作用的前提下,利用SVD技术将时空序列分解为空间模式、时间模式以及模式强度的乘积,通过
ARIMA模型对平稳的时间模式进行建模并得到其预测结果,在此基础上,将时间模式的预测结果与分解得到的空
间模式相结合,利用SVD技术对真实的时空序列进行重建,得到各个空间点的最终预测结果。实验结果表明,与
ARIMA、Lasso-VAR、LSTM和STARMA模型相比,ST-SVD模型的训练时间成本降低50%以上,预测精度提升10%
以上,其在实际工程应用中能够有效完成时空序列预测任务。关键词:时空序列预测;奇异值分解;STARMA模型;VAR模型;长短时记忆网络;基站流量开放科学(资源服务)标志码(OSID):
||||中文引用格式:杨立宁,李艳婷.基于SVD和ARIMA的时空序列分解与预测[J].计算机工程,2021,47(3):53-61.
英文弓I
用格式:YANG
Lining,
LI
Yanting.
Spatio-temporal
quence
decomposition
and
prediction
bad
on
SVD
and
ARIMA[
J].Computer
Engineering,2021,47(3):-Temporal
Sequence
Decomposition
and
Prediction
Bad on
SVD
and
ARIMAYANG
Lining,LI
Yanting
(
School
of
Mechanical
Engineering,Shanghai
Jiao
Tong
University,Shanghai 200240,China)[Abstract]
To
address
the
difficulty
of
estimating
the
spatial
weight
matrix
in
the
traditional
spatial-temporal
quence
modeling
process,this
paper
propos
a
spatial-temporal
quence
decomposition
model,ST-SVD,bad
on
singular value
original
spatial-temporal
quence
matrix receives
the
stationary
test
and
is
centralized
into
a
zero-mean
stationary
spatial-temporal
,assuming
that
there
is
no
interaction
between
time
and
space,the
spatial-temporal
quence
is
decompod
into
the
product
of
the
spatial
pattern,the
temporal
pattern,and
the
pattern
the
ARIMA
model
is
ud
to
model the
stable
time
pattern
and
get
the
prediction
result
of
the
time
this
basis,
the
prediction
result
of
the
time
pattern
is
combined
with
the
spatial
pattern
obtained
from
the
real
spatial-temporal
quence
is
reconstructed
by
using
the
singular
value
decomposition
technique
to
obtain
the
final
prediction
results
of
each
spatial
experimental
results
show
that
compared
with the
ARIMA, Lasso-VAR,
LSTM
and
STARMA
models,
ST-
SVD
reduces
the
model
training
time
cost
by
more
than
50%,
while
improving
the
prediction
accuracy
by
over
10%.It
can
efficiently
complete
the
prediction
of
spatial-temporal
quence
in
actual
engineering
applications.[Key
words] spatio-temporal
quence
prediction;
Singular
Value
Decomposition(SVD)
;
STARMA
model;
VAR
model;
Long
and
Short
Term
Memory(
LSTM)
network;
ba
station
trafficDOI:
10.
19678/j.
issn.
1000-3428.
00568850概述时空数据是指同时具有时间和空间维度的数
据[11,传感器、移动电话、射频识别(RFID)和智能电
网等智能设备的发展促进了实时时空数据流的采基金项目:国家自然科学基金(71672109)o集。考虑一个时空随机过程,时空建模的目标是基
于时空数据构建时空模型以对给定时刻所有位置的
行为进行预测[21o若不考虑时间因素,可以采用单
纯的空间模型进行建模,如kriging方法[31,但是其准
确性较低,添加时间维度可以提高预测的准确性。
作者简介:杨立宁(1994-),男,硕士研究生,主研方向为时空序列建模、高维时空数据统计与建模;李艳婷(通信作者),副教授、博士收稿日期:2019-12-12
修回日期:2020-01-29
E-mail:
*************
54计算机工程2021年3月15日随着时空数据流采集难度的降低,时空序列建模逐
渐成为学者们的研究热点之一。目前,关于时空序列预测主要分为基于物理模
型、基于统计模型和基于机器学习的3种方法。基
于物理模型的方法首先对时空序列的机理进行研
究,寻找其内在的系统动力学规律并构建系统动力
学模型,然后对时空序列进行表达进而预测。其中,
JONES等人[41提出随机偏微分方程以描述连续型时
空随机过程。
基于统计模型的方法主要分为描述型
时空模型和动态时空模型两类。前者利用统计学中
的描述型统计量表达时空模型的性质,并对统计量
进行建模以消除随机误差;后者考虑时间和空间的
自相关性并利用过去和其他地区的数据对当前数据
进行建模,然后实现迭代更新预测。近年来,随着机
器学习和深度学习的不断发展,人工智能技术被广
泛应用于时空序列建模和预测任务。通过机器学习
模型能够提取时空序列中复杂的特征模式,也可以
对高维时空序列进行降维和聚类从而使得分析更
简便。本文提出一种分离时空数据中的时间模式和空
间模式并分别建模的方法。对原始数据进行平稳性
检验并中心化,利用奇异值分解(SVD)分解中心化的
数据集,通过时间序列模型中经典的ARIMA模型对
时间模式建模并检验其有效性,然后利用ARIMA模
型预测时间序列,将预测结果与空间模式相结合并
对真实时空序列进行重建,以得到各个地理观测点
的预测值。1相关工作描述型时空模型较早以时空协方差为研究对
象,通过对样本协方差值进行曲面拟合获得协方差
函数,然后利用协方差函数分析时空模式的演变。
时空kriging方法[5-71基于时空过程的协方差函数给
出未知地区给定时刻的最优线性无偏估计。但是,
由于时空协方差是一种描述型统计量,很难解释时
空模式的内在动态变化。
描述型时空模型在数学上
更通用,但是动态时空模型在科学上有更强的解释
性[81。动态时空模型基于条件概率分布进行建模,
其中最主要的动态时空模型为层次时空模型。
层次
时空模型可分为2个主要类别:一类是经验层次模
型,其认为观测到的时空过程是真实时空过程的演
变以及真实过程通过某种函数作用产生观测过程,
其机制类似于隐马尔可夫过程;另一类是贝叶斯层
次模型,和经验层次模型的主要区别在于,贝叶斯层
次模型认为真实过程中的参数也是动态变化的,其
在经验层次模型的基础上增加了底层的参数过程,
因此,贝叶斯层次时空模型将时空序列过程分解为
参数过程、真实过程和数据过程3个层次并分别
建模[8-101o无论经验层次模型还是贝叶斯层次模型,真实
过程都是最重要的,其对理解时空动态变化模式具
有重要意义。因此,时空模型的一个研究重点在于
真实过程的模型构建。
统计时空模型的构建主要来
源于时间模型和空间模型的结合。CLIFF和0RD较
早将时间序列模型应用于空间分析中,提出空间自
回归模型(SAR)、空间移动平均模型(SMA)和空间
回归模型(SR)等[111。MARTIN和OEPPEN将空间
信息整合到传统的ARIMA模型[121中,提出STARMA
模型[121。STARMA定义了空间阶次的概念并在真实
应用中产生了良好效果[13-151
o但是,随着时空数据的
概念外延,STARMA模型中关于欧式距离越小则空
间阶次越低的假设越来越难以满足,使得其在一些
未知空间相关性结构的数据集中表现较差。BESSA
等人结合其他地区的历史数据和待预测地区的数
据,构建向量自回归模型VAR[161以对时空序列进行
建模描述。但是,VAR模型中的待估计参数空间较
大,一方面需要消耗极大的计算资源,另一方面可能
由于样本量不足而引起过拟合问题。因此,基于
Lasso的VAR(Lasso-VAR)模型被广泛应用[171,尽管
Lasso-VAR在一定程度上解决了模型过拟合问题,
但是其优化模型变得更难求解,计算成本过高。BAHADORI等人[181通过将时空数据作为张量
进行处理,提出一种低秩张量学习框架以进行多元
时空序列分析。BAROCIO等人[191通过动态模式分
解的方式对时空数据进行降维并提取时空特征。
LI[t1
利用梯度提升回归树
/
Gradient
B
oosting
Regression
Tree,GBRT)算法对城市共享单车的时空数据进行
建模并预测数量。在深度学习方法中,递归神经网
络 /
Recurrent
N
eutral
N
etwork,
RN
N)和深度神经网
络(Deep
Neutral
Network,DNN)被广泛应用于时空
序列模型构建任务。SHI[211利用RNN模型的一个变
体,即长短时记忆(Long
and
Short
Term
Memory,
LSTM)
网络对地区的降雨量进行预测。CHE等人[221将传统
的RNN拓展到时空领域,提出时空递归神经网络
(
Spatio-Temporal
Recurrent
Neural
Network,
ST-RNN),
以对时空序列进行建模预测。类似地,在深度学习
方面,ZHANG等人[231将深度残差网络拓展到时空领
域,提出时空深度残差模型(ST-ResNet)以对人流量
进行预测。2算法描述2.1时空数据的奇异值分解SVD是一种矩阵分解技术,其在信号处理和统
计学中有很多应用[241o给定一个秩为l的时空数据
矩阵Yd
x
T,其中,D表示空间中观测点的个数,表示
第47卷第3期杨立宁,李艳婷:基于SVD和ARIMA的时空序列分解与预测55采样时间点的个数。时空数据矩阵Ydxt的奇异值分
解如下:Y
=
USV'
=
s1
u
1
v
1
+
s
2
u
2
v2
+
—+
sl
u
l
v
(
1)其中,U
=
(u
1,
u2,
—,
uj,
V
=
(v
1,
V2,
—,
vl),S
=
diag{sn
s2, —,
sl},且
s
1》s2》…》sl
A
0o
向量
u(i
=
1,
2,…,l)
是左奇异矩阵的列向量,向量vXi
=
1,
2,…,l)是右奇
异矩阵的行向量,标量亠称为奇异值。假设{c”:”
=
1,2,
—,
T}是矩阵Yd
x
T的列向量,”
代表给定的m时刻D中所有空间单元的观测值,YY'
表达了
D空间单元之间的相关性,这里假定Ydxt已
经去中心化为零均值矩阵。矩阵Ydxt的ui事实上是
相关矩阵YY'的特征向量,u
1表示相关矩阵YY'对应
特征值最大的特征向量,包含了空间相关性最多的
信息量,或被称为“空间模态”,表征了空间相关性的
模式。u
i的第j个分量Uj表示第j地区对第i空间模
态的“贡献”。类似地,假定{r”:”
=
1,鸟,…,。}是矩
阵Yd
x
t的行向量,”代表”位置在整个时间段的观测
值向量,Y
'Y表达了不同时刻之间的相关性,矩阵
Yd
x
T的v:事实上是相关矩阵Y
'
Y的特征向量,1表示
相关矩阵Y'Y对应特征值最大的特征向量,包含了
时间相关性最多的信息量,或被称为“时间模态”,表
征了时间相关性的模式。r;的第j个分量rj表示第
j时刻对第i时间模态的“贡献”。时空矩阵Yd
x
T分解
后的S是奇异值矩阵,i表示模式i的重要程度,例
如,若s
1是最大的奇异值,则s
1对应的模式1具有表
征空间模式的最重要的特征。2.2基于SVD的时空序列模型给定历史时空数据矩阵Yd
x(t
-1),对当前时刻t的
各个地理观测点进行预测的具体步骤如下:步骤1通过SVD对中心化后的时空矩阵进行
分解。假定历史时空数据矩阵Ydx(t-1)的秩为l,可利用
式(1)得到如下分解:YD
x
(t
-
1)
=
s 1
u 1
vj
+
s2
u
2 v2 +
…+
slu
l
v'l
(2)SVD有一个重要的性质,定义奇异值占比Er
=
還£r
=
si」,则当r
<<
l时,可达到85%以上的水平,剩余
£=
sii
=
1的可认为是噪声。因此,通过选取前几个奇异值与
对应的左奇异向量和右奇异向量进行重建,可以对
矩阵实现降噪,如下:YD
x
(t
-
1)
=
s 1
u 1
v1
+
s2
u
2 v2 +
…+
Sr
u
r
v'r
(3)步骤2通过ARIMA[251对时间模式进行建模预测。由于分解之后得到的右奇异向量v:可以看作时
间序列,因此本文利用时间序列中应用最广泛、效果
最好的ARIMA模型进行建模。ARIMA的标准模型
如下:V"vi,
t
=
P
+
01V"vi,
t-1
+
…+
0p
V"vi,
t-p +
£t
-01
£t
-
1
Oq
£t
-
q
(4)其中,VdVi,,代表t时刻第i个向量的d阶差分,t是t时
刻均值为0的随机误差,“、0(i
=
1,2,
—,p)=
1,2,
—,
q)为待估计参数。利用AIC、BIC信息准则和
最大似然法进行模型选择和估计,当得到估计好的
模型后,利用该模型进行h步向前预测,如下:vi,
t+h
=
01V"vi,
t+h-1
+
…+
0p
V"vi,
t+h-p +
£t
-01
£t
+
h
- 1
----------0q
£t
+
h
-
q
(5)步骤3利用SVD进行重建得到h步向前预测
结果。当得到时间模式的估计值后,利用已经存储的
奇异值和对应的左奇异向量重建时空矩阵,得到最
终预测结果:Yt
+
h
=
s
1
u
1
v1
t
+
h
+
s2
u
2
v2,
t
+
h
+
…+
sr
u
r
v'r.
t
+
h
(6)2.3模型优化模型优化包括奇异值选择和ARIMA模型参数选
择过程。针对奇异值选择,不同的奇异值个数重建的
矩阵精度不同,通常情况下,利用前几个较大奇异值即
可基本重构原始时空矩阵,剩余奇异值可理解为由数
据波动形成的噪音。本文通过遍历的方式验证了不同
的奇异值个数对最后效果的影响,最终设定对前2个
奇异值对应的时间模式进行建模。
针对时间模式
ARIMA模型的构建,首先需要对时间模式的平稳性进
行检验,若不平稳,需要将其转化为平稳模式并在后续
模型中逆推回真实预测结果;当数据平稳性检验通过
后,利用ARIMA模型对平稳时间模式进行建模,并利
用ACF和PACF图[251确定ARIMA模型中的p、d和q参
数取值;最后通过交叉验证以及信息准则AIC、BIC[261
对模型有效性进行检验并选择最优模型,在检验通过
后,利用得到的ARIMA模型完成预测。本文所提ST-
SVD算法描述如算法1所示,算法流程如图1所示。算法1
ST-SVD算法输入时空矩阵Yd
y_1),预测步长l输出D个基站的l步预测值1.
给定奇异值分解的阈值thre(本文设定为85%)2.
对丫。*
“
-
1)进行奇异值分解,得到U、S和V3.
利用阈值thre(85%)选择U、S和V中的有用成分4.
通过ARIMA模型对选定的V进行建模并根据AIC、
BIC选定最优ARIMA模型5.
利用最优ARIMA模型进行l步预测6.
将预测结果与选定的U、S进行乘积,重建D个基站的
预测值
56计算机工程2021年3月15日训练集:前160
h数据测试集:后56
h数据模型训练模型测试与性能比较根据训练得到的ARIMA模型
对后续时间行为进行预测1训练数据集~、奇异值分解右奇异矩阵F奇异值的累积
比重超过85%r|奇异值个数选择|利用左奇异矩阵和选择的
奇异值重构时空矩阵得到
预测结果K+i通过Bootstrap
提高预测精度模型评估,并与其他4种模型
进行比较(ARIMA、Lasso-VAR、
LSTM>
STARMA)利用
ARIMA
对右奇异
矩阵的每
一个时间
向量进行建模参数选择方法:AIC、BIC信息准则I
ARIMA
模型
输出模型评估结果
(指标为RMSE和MAE)图1
ST-SVD算法流程Fig.1
Procedure of
the
ST-SVD
algorithm3案例分析3.1数据集描述本文利用中国某大型城市的2
333个基站在
216
h(共9天)内的流量数据对所提ST-SVD算法进
成训练集和测试集,训练集包含前160
h的数据,测试集包含剩余56
h的数据行验证,数据的采集频率为1次/ho图2所示为
2
333个基站的相对位置布局,经纬度已经过处理,
—T表1所示为其中5个基站在13
h内的流量数据示例。
图3所示为3个基站在216
h内的流量变化情况,从
图3可以看出,基站3具有较明显的9个峰,表明基
站流量的变化基本以一天为周期,虽然另外2个基
站中基站1也存在较类似的峰值,但是两者的整体
变化有较大差异。本文将216
h内的流量数据拆分图2
2 333个基站的布局Fig.2
Layout of
2
333
ba
stations
第47卷第3期杨立宁,李艳婷:基于SVD和ARIMA的时空序列分解与预测表1
5个基站的部分历史流量数据片段Table 1
Partial
historical traffic data
fragments
of
five
ba
stations
57Kb日期时间13:00:0014:00:0015:00:0016:00:00基站
125
649基站
2262
041基站
3166
052206
333183 292基站
4223 005221
221235
454186
324基站
5469
4265
5852
91668126418
402312
000288
882206
590163
356677
779691
959559
721173 216136
5432014-03-0117:00:0018:00:0019:00:00109
47197
08154
12914
7258
119395
681356
533273
781125 79985
984117
155153
35217
87016
06620:00:0021:00:0010
1083
09033150
000流量的时空数据,距离越近相关性越大的假设并不
40
000§
30
000麗
20
00010
000成立。时间/h(a)基站1图4时间相关性矩阵Fig.4
Time
correlation
matrix时间/h(b)基站2350
000300
0005
250
000益 200
000J!
150
000100
00050
000图3
3个基站在9天内的流量情况Fig.3
Traffic
situation
of
three
ba stations
in nine
days图5相关性与空间距离的散点图Fig.5
Scatter
plot
of
correlation
and
spatial
distance3.2
ST-SVD模型构建ST-SVD模型构建步骤如下:步骤1通过奇异值分解对中心化后的时空矩
图6所示为排序后的奇异值,一般而言,前几个
奇异值即可涵盖大部分信息。从图6可以看出,前2个奇异值占据了奇异值之和的89%,因此,本文分
阵进行分解。在本案例中,时空矩阵Y的大小是
2
333x160,在进行数据预处理(异常值处理、平稳性
别构建一个奇异值的重建算法ST-SVD(1)和两个奇
异值的重建算法ST-SVD(2)。1412处理)之后,通过对处理后的Y进行奇异值分解,得
到左奇异矩阵、右奇异矩阵和奇异值。图4所示为
截取的时空矩阵Y的右奇异矩阵,即时空序列的时
o
10间模式,此处截取了一天内每个小时之间的相关性
情况,黄色区域表明相关性较强(彩色效果见《计算
机工程》官网HTML版),从图4可以看出,时间相关
1
……““
”"M性具有较明显的周期模式,并且可预测性较强。图5
所示为时空矩阵Y中不同地点的皮尔逊相关系数与
索引图6降序排列的奇异值距离之间的关系,从图5可以看出,针对该区域基站
Fig.6
Singular values
of descending
order
58计算机工程2021年3月15日表2模型拟合程度指标Table
2图7、图8分别对应前2个奇异值的左奇异矩
阵(空间模式)和右奇异矩阵(时间模式)。从中可
以看出,空间模式较为复杂,没有明显规律,但是时
vIndex of
model
fitting
degreeMAE0.010.00
RMSE0.020.01AICBIC-771.60间模式显示出
明显的周期性和可预测性。
因此,
本
文利用ARIMA模型分别对2个时间序列进行建模
v1-780.81卩2-1
143.43-1
118.83并预测。RMSE和MAE[271的计算公式分别如下:RMSE
=
J
D
f
f
(几
7)
it(9)MAE
=
D(10)步骤3利用境异值分解进行重建得到h步向
前预测结果。在得到t时刻时间模式的预测值v
1
t和
v,
t后,即可利用式(1)结合左奇异矩阵和奇异值重建
时空矩阵,得到t时刻空间各个位置的预测值。考虑
f
f
几-几
Fig.7
Left
singular
matrix0.2_0
2_____i______i______i_____i______i______i______i______i'0
20
40
60
80
100
120
140
160时间/h图8右奇异矩阵Fig.8
Right
singular
matrix步骤2通过AIC和BIC信息准则(表2)选择
ARIMA模型中的pd参数并得到下述结果:vit
=-0.072
6
+
1.635
1
v-0.5319
v、一2
-0.1964
V—
+
0.1509 e,
_
1
-0.545
0e一2
-
0.369
1
et-3
、、、(7)v2,
t
=
1.263
5
v2,
t-1
+
0.263
5
v?,t_2
+0.721
1
et
-1
-
0.721
1
et
-
2
(8)到流量的周期性一般为一天,因此,本文利用
ARIMA模型分别向前1步、向前6步、向前12步和向
前24步进行预测,并利用Bootstrap[281从2
333个基
站中抽取不同的样本量,从100次实验中取均值作
为最终结果,以评估算法在整个周期内不同预测长
度下的准确度和预测性能。3.3模型性能比较本文将ST-SVD(1)、ST-SVD(2)与现有常用的
ARIMA、Lasso-VAR,
LSTM
和
STARMA
4
种
模型进
行对比。其中,ARIMA模型并不是时空序列模型,
但是在不考虑空间观测点的相关性时时空序列变成
独立的多个时间序列,可以分别利用ARIMA进行建
模预测。ARIMA模型时间成本极高,但是可作为一
种基线模型进行对比。Lasso-VAR是带有Lasso正
则化约束的VAR模型,其认为时空模型是时间序列
模型加空间维度,即增加一维,然后通过传统的VAR
模型并添加Lasso正则化来降低过拟合风险。LSTM
是递归神经网络的变体,适用于时间序列,其与VAR
类似,将时空数据集的空间维度叠加到时间序列中
进行训练预测。STARMA模型是经典的时空分析模
型,本文采用欧氏距离定义模型中的空间权重矩阵。
实验过程中使用的软件、软件依赖包信息以及模型
关键参数如表3所示。表3实验过程中的软件、软件依赖包以及模型关键参数信息Table
3
The
software
‘software
dependency packages
and
key
parameters
information
of
the
model
during
the
experiment模型软件R语言R语言R语言软件依赖包forecastforecastforecast关键参数奇异值个数ST-SVD(1)ST-SVD(2)ARIMAARIMA模型参数p,q,ARIMA模型参数p,q,Lasso-VARMATLABPythoncvxkeras,tensorflow,pandas,numpy惩罚系数,模型阶数,系数矩阵网络层数,隐含层神经元个数LSTMSTARMAR语言starma空间权重矩阵,AR和MA阶数利用10个、20个、50个和100个基站160
h内的
数据分别对上述6种模型进行训练,并给出向前
1步、6步、12步和24步的预测结果,利用常见的预
测精度指标一均方根误差RMSE和绝对值误差
MAE对预测性能进行评估。由于本文案例中共有
2
333个基站,为了提高性能评估的准确性并降低
方差,通过Bootstrap在2
333个基站中随机选取上
述10个、20个、50个和100个基站100次,并对
100次的实验结果取平均值以作为最终的性能评估
结果。
第
47
卷
第
3
期杨立宁,李艳婷:基于SVD和ARIMA的时空序列分解与预测59表4所示为上述6种模型向前1步的部分预测
结果,加粗数字为最优预测结果,括号中的百分数表
示预测百分比误差,计算公式如式(11)所示,表示
预测值,表示真实值。型需要足够多的样本来提高精度;STARMA模型优于
不添加空间信息的ARIMA模型;ST-SVD的2种模型
相较于其他4种模型预测准确率更优。具体地,利用
2个奇异值的ST-SVD(2)模型的预测误差约为0.13,
y
-
y
error
=--------
11y()ARIMA丄asso-VAR丄STM和STARMA的误差分别
约为
0.22、0.21、0.92和
0.19。ST-SVD(1)和
ST-SVD(2)
从表4可以看出:LSTM模型的预测精度最差,原
因是其数据量过少,模型欠拟合,这表明神经网络模
明显优于其他4种对比模型且ST-SVD(2)优于ST-
SVD(
1)。表4
6种模型的1步预测结果Table
4
One-step
prediction
results
of six
models序号真实数据ST-SVD(1)221
879(0.15)ST-SVD(2)218
495(0.17)150
575(0.09)ARIMALasso-VARLSTM24
386(0.91)STARMA12262
041166
052223
006469
427176
025(0.33)135
693(0.18)141 907(0.36)199
551(0.24)156
520(0.06)161
877(0.27)189
318(0.28)144
980(0.13)149
596(0.11)190
603(0.17)15
816(0.90)24
490(0.89)24
074(0.95)21
181(0.93)34193
918(0.15)401
761(0.14)159
213(0.29)403
218(0.14)258
275(0.19)708
781(0.23)564
155(0.16)1
056
788(0.13)826
613(0.21)360
880(0.23)225
828(0.27)377
502(0.20)239
820(0.22)708
834(0.23)509
532(0.24)372
671(0.21)237
912(0.23)830
233(0.10)610
391(0.09)1
034
435(0.15)567307
348915
579670
7361 212 8401
050
55526
273(0.17)745
144(0.19)626
856(0.07)811
109(0.11)35
440(0.96)30
228(0.95)22
153(0.98)26
960(0.97)27
723(0.80)599
095(0.11)1
085
398(0.11)886
153(0.16)98
968(0.30)89101
119
314(0.08)974
010(0.20)881
768(0.16)124
619(0.12)831
411(0.21)903
549(0.14)107
845(0.24)0.19141
078—123
028(0.13)0.16108
754(0.23)0.21平均误差0.130.220.92表5所示为上述6种模型在4种不同基站个数以
及4种不同预测步长情况下的RMSE,括号中为MAE。
对比模型,而且ST-SVD(2)的重构结果稍优于ST-SVD(
1)
的重构结果。从图9、图10可以直观地看出,2种ST-SVD
模型的误差低于其余4种对比模型。从表5可以看出,ST-SVD模型的性能明显优于其余4种
表5 6种模型在不同基站个数与预测步长情况下的实验结果Table
5
Experimental
results
of
six
models under
different
number
of
ba
stations
and
different
prediction
step
size预测步长基站数ST-SVD(1)109.31(84.21)ST-SVD(2)85.63(70.38)ARIMALasso-VAR67.21(54.27)125.37(97.29)LSTMSTARMA102083.26(75.15)134.29(101.44)125.34(81.21)102.21(67.23)341.56(218.38)346.25(221.30)282.31(172.35)231.55(140.64)293.53(180.42)294.82(187.31)245.19(152.76)200.37(126.38)255.37(161.36)231.43(161.28)211.57(131.65)112.35(73.17)162.84(121
.07)92.41
(78.23)125.31
(86.57)117.28(63.85)97.34(71.11)76.31(61.35)60.21(41.80)55.73(33.48)1步5081.70(51.65)65.37(38.12)207.32(101.21)147.34(102.54)162.54(120.02)213.39(100.62)232.41(117.34)232.36(140.37)242.28(190.21)352.17(210.56)284.31(177.48)275.13(175.39)239.25(166.18)309.12(192.31)300.51(200.34)232.49(148.12)212.43(136.76)76.21
(51 .31
)98.53(66.21
)10096.32(56.29)10206步202.31(100.42)191.42(98.45)162.74(86.34)135.75(74.41)234.65(108.28)226.52(249.56)312.84(152.37)317.47(138.19)263.16(80.74)188.94(100.43)162.25(90.23)143.89(76.45)50195.62(108.54)103.43(75.48)100217.65(94.31
)1020180.17(101.21)176.34(103.45)151.32(86.23)126.18(73.23)143.25(80.21)135.66(76.12)118.15(68.19)101.32(57.38)173.23(102.34)163.41(95.37)146.25(84.38)120.34(67.89)132.71(75.19)127.25(73.27)114.28(63.15)414.35(232.54)412.35(248.21
)334.52(200.98)240.17(145.29)265.37(172.53)234.04(1
53.42)12步50253.49(137.68)215.91(113.18)273.48(145.81
)1001020390.21
(241
.52)431.21(282.49)365.18(231.06)245.10(151.25)253.65(132.18)228.63(117.35)192.31(108.73)24步5010095.12(55.31)174.67(109.21)
60计算机工程2021年3月15日(a)向前1步预测(b)向前6步预测基站数(c)向前12步预测(d)向前24步预测图9
6种模型在不同基站个数与预测步长下的RMSEFig.9
RMSE
of
six
models under
different
number
of
ba stations
and
different
prediction
step
size-e-ST-SVD(l)模型
-B-ST-SVD(2)癮型
Y-ARIMA
檯型
-A-Lasso-VAR
模型
*LSTM模型
4STARMA模型-e-ST-SVD(l)模型
-B-ST-SVD(2)欖型
Y-ARIMA
癮麺
-A-Lasso-VAR
模型
*LSTM模型
ASTARMA
模型基站数(a)向前1步预测-e-ST-SVD(l)模型
-B-ST-SVD(2)欖型
Y-ARIMA
穰型
虫-Lasso-VAR模
型
*LSTM模型
-b-STARMA模型基站数(b)向前6步预测-e-ST-SVD(l)模型
-B-ST-SVD(2)欖型
-0-ARIMA
癮型
虫-Lasso-VAR模
型
*LSTM模型
4STARMA模型基站数
(c)向前12步预测
基站数(①向前24步预测图10
6种模型在不同基站个数与预测步长情况下的MAEFig.10
MAE
of six
models under
different
number
of
ba stations
and
different
prediction
step
size4结束语时空序列模型STARMA通过构建空间权重矩阵
来表征数据的空间相关模式,但是空间权重的构建大
多依赖距离等主观性因素,导致STARMA难以适用于
多数数据集。本文建立一种新的时空序列模型ST-SVD,
其利用SVD技术对时空数据集的时间模式和空间模
式进行自动分解,通过ARIMA模型拟合时间模式并建
模预测,最终重建出时空预测结果。ST-SVD模型不需
要对数据集的空间结构进行假设,只需对时间序列实
现建模,大幅降低了问题复杂度和模型训练成本。实
验结果表明,ST-SVD模型的预测效果优于LSTM、
第47卷第3期杨立宁,李艳婷:基于SVD和ARIMA的时空序列分解与预测61STARMA等时空序列模型。但是,本文研究尚存在一
定不足,一是ST-SVD认为空间模式是时不变的,即空
间作用和时间作用相互独立,二是在奇异值分解后的
时间序列建模中利用了较为传统的ARIMA模型,该模
型是一种线性模型,无法捕捉到时间序列中的非线性
模式。下一步将利用机器学习、深度学习等技术对时
间模式进行建模,然后通过奇异值分解重建时空序列,
以解决上述问题。参考文献[1
]
CRESS
IE
N,
WIKLE
C
K.
Statistics
for
spatio-temporal
data[M].
[S.
l.
]:
John
Wiley &
Sons,2015.[2
]
HUANG
H
C,
CRESSIE
N.
Spatio-temporal
prediction
of
snow
water
equivalent
using
the
Kalman filter
[
J].
Computational
Statistics
&
Data
Analysis,
1996,22(2):
159-175.[3
]
CRESSIE
N. The
origins
of
kriging
[J].
Mathematical
Geology,1990,22(3):239-252.[4
]
JONES
R
H,
ZHANG
Y
M.
Models
for
continuous
stationary
space-time
process
[M]//GREGOIRE
T
G.
Modelling
longitudinal
and
spatially
correlated
data.
Berlin,
Germany
:
Springer ,
1997
:
289-298.[5
]
MONTERO
J,
FERNANDEZ-AVILES
G,
MATEU
J.
Spatial
and
spatio-temporal
geostatistical
modeling
and
kriging[M].
[S.
l.
]:John
Wiley &
Sons,2015.[6
]
HOOPER
P
M,
HEWINGS
G
J
D.
Some
properties
of
space-time
process
[J].
Geographical
Analysis,
2010,
13(
3):
203-223.[7
]
OLIVER
M
A,
WEBSTER
R.
Kriging:
a
method
of
interpolation
for
geographical
information
systems
[J].
International
Journal
of
Geographical
Information
Systems
,
1990,
4(
3):
313-332.[8
]
CRESSIE
N,
JOHANNESSON
G.
Fixed
rank
kriging
for
very
large
spatial
data
ts[
J].
Journal
of
the
Royal
Statistical
Society:
Series
B(
Statistical
Methodology)
,
2008,70(1):209-226.[9
]
CRESSIE
N,SHI
T,KANG
E L. Fixed
rank
filtering
for
spatio-temporal
data[
J].
Journal
of
Computational
and
Graphical
Statistics,2010,19(3):724-745.[10]
NGUYEN
H,
KATZFUSS
M,
CRESSIE
N,
et
al.
Spatiotemporal
data
fusion
for
very
large
remote
nsing
datat[s
J]. Technometrics,2014,56(2) :
174-185.[11]
CLIFF
A
D,
ORD
J
K.
Space-time
modelling
with
an
application
to
regional
forecasting
[
J].
Transactions
of
the
Institute
of
British
Geographers
,1975(64):
119-120.[12]
MARTIN
R
L,
OEPPEN
J
E.
The
identification
of
regional
forecasting
models
using
space
: time
correlation
functions
[J].
Transactions
of
the
Institute
of
British
Geographers,1975(
66):
95-98.[13]
PATRICK
J
D,
HARVILL
J
L,
HANSEN
C
W.
A
miparametric
spatio-temporal
model
for
solar
irradiance
data]
J].
Renewable
Energy,
2016,87:
15-30.[14]
ANDRE
M,
DABO-NIANG
S,
SOUBDHAN
T,
et
tive
spatio-temporal
model
for
spatially
spar
global
solar
radiation
dat[a
J].
Energy,
2016,
111:
599-608.15]
ZHAO
Youlin,
GE
Liang,
ZHOU
Yijun,
et
al.
A
new
asonal
difference
space-time
autoregressive
integrated
moving
average
model
and
spatiotemporal
trend prediction
analysis
for
hemorrhagic
fever
with
renal
syndrome[
J].
PLoS
One,2018,13(11):518-526.[16]
BESSA
R
J,
TRINDADE
A,
MIRANDA
V.
Spatial-
temporal
solar
power
forecasting
for
smart
grids]
J].
IEEE
Transactions
on
Industrial
Informatics,
2015,
11
(1):
232-241.[17]
MESSNER
J
W,
PINSON
P.
Online
adaptive
lasso
estimation
in
vector
autoregressive
models
for
high
dimensional
wind
power
forecasting
[J].
International
Journal
of
Forecasting,
2019,35(
4)
:
1485-1498.[18]
BAHADORI MT,YUQ
R,LIU
Y.
Fast
multivariate
spatiotemporal
analysis
via
low
rank
tensor
learning
[
C]//
Proceedings
of Advances
in
Neural
Information
Processing
Systems.
Washington
D.
C.
,
USA:
IEEE
Press,
2014:3491-
3499.[19] BAROCIO
E,
PAL
B
C,
THORNHILL
N
F,
et
al.
A
dynamic
mode
decomposition
framework
for
global
power system
oscillation
analysis
[J].
IEEE
Transactions
on
Power
Systems,2015,30(6):2902-2912.[20]
LI
Yexin,
ZHENG
Yu,
ZHANG
Huichu,
et
al.
Traffic
prediction
in
a
bike-sharing
system[C
]//Proceedings
of
the
23rd
SIGSPATIAL
International
Conference
on
Advances
in
Geographic
Information
Systems.
New
York,
USA:ACM
Press,2015:33-39.[21]
SHI
Xingjian,
CHEN
Zhourong,
WANG
Hao,
et
al.
Convolutional
LSTM
network:a
machine
learning
approach
for
precipitation
nowcasting[EB/OL].[2019-11-10].
arxiv.
org/abs/1506.
04214.22]
CHE
Z
P,PURUSHOTHAM
S,CHO K,et
al.
Recurrent
neural
networks
for
multivariate
time
ries
with
missing
values
J].
Scientific
Reports,2018,8:6085-6090.[23]
ZHANG
J
B,
ZHENG
Y,QI
D
K.
Deep
spatio-temporal
residual
networks
for
citywide
crowd
flows
prediction[EB/
OL].[2019-11-10].
https
://arxiv.
org/abs/1610.
0
0081.24]
HOWARD
J
P.
Data-driven
modeling
&
scientific
computation:methods
for
complex
systems
&
big
data
EB/
OL].[2019-11-10].
www.
amazon.
com/Data-
Driven-Modeling-Scientific-Computation-Methods/dp/019
9660344.[25 ]
BROCKWELL
P
J,
DAVIS
R
A.
Fowcasting
techniques
[
M
]
//
S
HANMUG
AM
R.
Introduction
to
time
ries
and
forecasting.
Berlin,Germany:Springer,2016:309-321.26]
BURNHAM
K
P,ANDERSON
D
R.
Multimodel
inferenc[e
J].
Sociological Methods
&
Rearch,2004,33(2):261-304.[27]
WILLMOTT
C
J,MATSUURA
K.
Advantages
of
the
mean
absolute
error over the
root
mean
square
error
in
asssing
average
model
performanc
[e
J].
Climate
Rearch,2005,30: 79-82.[28 ]
RUBIN
D
B.
The
Bayesian Bootstrap
[J].
The
Annals
of
Statistics,1981,9(1):130-134.编辑吴云芳
本文发布于:2024-02-15 20:02:35,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/zhishi/a/1707998555249199.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:基于SVD和ARIMA的时空序列分解与预测.doc
本文 PDF 下载地址:基于SVD和ARIMA的时空序列分解与预测.pdf
留言与评论(共有 0 条评论) |