基于SVD和ARIMA的时空序列分解与预测

更新时间:2024-02-15 20:02:35 阅读: 评论:0

2024年2月15日发(作者:中国移动面试)

基于SVD和ARIMA的时空序列分解与预测

第47卷第3期Vol.47

No.3•人工智能与模式识别・计算机工程2021

3

月Computer

Engineering文章编号:1000-3428

(2021)

03-0053-09文献标志码:AMarch

2021中图分类号:TP301.6基于SVD和ARIMA的时空序列分解与预测杨立宁,李艳婷(上海交通大学机械与动力工程学院,上海200240)摘要:针对传统时空序列建模过程中估计空间权重矩阵时难度较高的问题,提出一种基于奇异值分解(SVD)的

时空序列分解模型ST-SVDo对原始时空序列矩阵进行平稳性检测并中心化为零均值平稳时空序列,在假设时间

和空间没有交互作用的前提下,利用SVD技术将时空序列分解为空间模式、时间模式以及模式强度的乘积,通过

ARIMA模型对平稳的时间模式进行建模并得到其预测结果,在此基础上,将时间模式的预测结果与分解得到的空

间模式相结合,利用SVD技术对真实的时空序列进行重建,得到各个空间点的最终预测结果。实验结果表明,与

ARIMA、Lasso-VAR、LSTM和STARMA模型相比,ST-SVD模型的训练时间成本降低50%以上,预测精度提升10%

以上,其在实际工程应用中能够有效完成时空序列预测任务。关键词:时空序列预测;奇异值分解;STARMA模型;VAR模型;长短时记忆网络;基站流量开放科学(资源服务)标志码(OSID):

||||中文引用格式:杨立宁,李艳婷.基于SVD和ARIMA的时空序列分解与预测[J].计算机工程,2021,47(3):53-61.

英文弓I

用格式:YANG

Lining,

LI

Yanting.

Spatio-temporal

quence

decomposition

and

prediction

bad

on

SVD

and

ARIMA[

J].Computer

Engineering,2021,47(3):-Temporal

Sequence

Decomposition

and

Prediction

Bad on

SVD

and

ARIMAYANG

Lining,LI

Yanting

(

School

of

Mechanical

Engineering,Shanghai

Jiao

Tong

University,Shanghai 200240,China)[Abstract]

To

address

the

difficulty

of

estimating

the

spatial

weight

matrix

in

the

traditional

spatial-temporal

quence

modeling

process,this

paper

propos

a

spatial-temporal

quence

decomposition

model,ST-SVD,bad

on

singular value

original

spatial-temporal

quence

matrix receives

the

stationary

test

and

is

centralized

into

a

zero-mean

stationary

spatial-temporal

,assuming

that

there

is

no

interaction

between

time

and

space,the

spatial-temporal

quence

is

decompod

into

the

product

of

the

spatial

pattern,the

temporal

pattern,and

the

pattern

the

ARIMA

model

is

ud

to

model the

stable

time

pattern

and

get

the

prediction

result

of

the

time

this

basis,

the

prediction

result

of

the

time

pattern

is

combined

with

the

spatial

pattern

obtained

from

the

real

spatial-temporal

quence

is

reconstructed

by

using

the

singular

value

decomposition

technique

to

obtain

the

final

prediction

results

of

each

spatial

experimental

results

show

that

compared

with the

ARIMA, Lasso-VAR,

LSTM

and

STARMA

models,

ST-

SVD

reduces

the

model

training

time

cost

by

more

than

50%,

while

improving

the

prediction

accuracy

by

over

10%.It

can

efficiently

complete

the

prediction

of

spatial-temporal

quence

in

actual

engineering

applications.[Key

words] spatio-temporal

quence

prediction;

Singular

Value

Decomposition(SVD)

STARMA

model;

VAR

model;

Long

and

Short

Term

Memory(

LSTM)

network;

ba

station

trafficDOI:

10.

19678/j.

issn.

1000-3428.

00568850概述时空数据是指同时具有时间和空间维度的数

据[11,传感器、移动电话、射频识别(RFID)和智能电

网等智能设备的发展促进了实时时空数据流的采基金项目:国家自然科学基金(71672109)o集。考虑一个时空随机过程,时空建模的目标是基

于时空数据构建时空模型以对给定时刻所有位置的

行为进行预测[21o若不考虑时间因素,可以采用单

纯的空间模型进行建模,如kriging方法[31,但是其准

确性较低,添加时间维度可以提高预测的准确性。

作者简介:杨立宁(1994-),男,硕士研究生,主研方向为时空序列建模、高维时空数据统计与建模;李艳婷(通信作者),副教授、博士收稿日期:2019-12-12

修回日期:2020-01-29

E-mail:

*************

54计算机工程2021年3月15日随着时空数据流采集难度的降低,时空序列建模逐

渐成为学者们的研究热点之一。目前,关于时空序列预测主要分为基于物理模

型、基于统计模型和基于机器学习的3种方法。基

于物理模型的方法首先对时空序列的机理进行研

究,寻找其内在的系统动力学规律并构建系统动力

学模型,然后对时空序列进行表达进而预测。其中,

JONES等人[41提出随机偏微分方程以描述连续型时

空随机过程。

基于统计模型的方法主要分为描述型

时空模型和动态时空模型两类。前者利用统计学中

的描述型统计量表达时空模型的性质,并对统计量

进行建模以消除随机误差;后者考虑时间和空间的

自相关性并利用过去和其他地区的数据对当前数据

进行建模,然后实现迭代更新预测。近年来,随着机

器学习和深度学习的不断发展,人工智能技术被广

泛应用于时空序列建模和预测任务。通过机器学习

模型能够提取时空序列中复杂的特征模式,也可以

对高维时空序列进行降维和聚类从而使得分析更

简便。本文提出一种分离时空数据中的时间模式和空

间模式并分别建模的方法。对原始数据进行平稳性

检验并中心化,利用奇异值分解(SVD)分解中心化的

数据集,通过时间序列模型中经典的ARIMA模型对

时间模式建模并检验其有效性,然后利用ARIMA模

型预测时间序列,将预测结果与空间模式相结合并

对真实时空序列进行重建,以得到各个地理观测点

的预测值。1相关工作描述型时空模型较早以时空协方差为研究对

象,通过对样本协方差值进行曲面拟合获得协方差

函数,然后利用协方差函数分析时空模式的演变。

时空kriging方法[5-71基于时空过程的协方差函数给

出未知地区给定时刻的最优线性无偏估计。但是,

由于时空协方差是一种描述型统计量,很难解释时

空模式的内在动态变化。

描述型时空模型在数学上

更通用,但是动态时空模型在科学上有更强的解释

性[81。动态时空模型基于条件概率分布进行建模,

其中最主要的动态时空模型为层次时空模型。

层次

时空模型可分为2个主要类别:一类是经验层次模

型,其认为观测到的时空过程是真实时空过程的演

变以及真实过程通过某种函数作用产生观测过程,

其机制类似于隐马尔可夫过程;另一类是贝叶斯层

次模型,和经验层次模型的主要区别在于,贝叶斯层

次模型认为真实过程中的参数也是动态变化的,其

在经验层次模型的基础上增加了底层的参数过程,

因此,贝叶斯层次时空模型将时空序列过程分解为

参数过程、真实过程和数据过程3个层次并分别

建模[8-101o无论经验层次模型还是贝叶斯层次模型,真实

过程都是最重要的,其对理解时空动态变化模式具

有重要意义。因此,时空模型的一个研究重点在于

真实过程的模型构建。

统计时空模型的构建主要来

源于时间模型和空间模型的结合。CLIFF和0RD较

早将时间序列模型应用于空间分析中,提出空间自

回归模型(SAR)、空间移动平均模型(SMA)和空间

回归模型(SR)等[111。MARTIN和OEPPEN将空间

信息整合到传统的ARIMA模型[121中,提出STARMA

模型[121。STARMA定义了空间阶次的概念并在真实

应用中产生了良好效果[13-151

o但是,随着时空数据的

概念外延,STARMA模型中关于欧式距离越小则空

间阶次越低的假设越来越难以满足,使得其在一些

未知空间相关性结构的数据集中表现较差。BESSA

等人结合其他地区的历史数据和待预测地区的数

据,构建向量自回归模型VAR[161以对时空序列进行

建模描述。但是,VAR模型中的待估计参数空间较

大,一方面需要消耗极大的计算资源,另一方面可能

由于样本量不足而引起过拟合问题。因此,基于

Lasso的VAR(Lasso-VAR)模型被广泛应用[171,尽管

Lasso-VAR在一定程度上解决了模型过拟合问题,

但是其优化模型变得更难求解,计算成本过高。BAHADORI等人[181通过将时空数据作为张量

进行处理,提出一种低秩张量学习框架以进行多元

时空序列分析。BAROCIO等人[191通过动态模式分

解的方式对时空数据进行降维并提取时空特征。

LI[t1

利用梯度提升回归树

/

Gradient

B

oosting

Regression

Tree,GBRT)算法对城市共享单车的时空数据进行

建模并预测数量。在深度学习方法中,递归神经网

络 /

Recurrent

N

eutral

N

etwork,

RN

N)和深度神经网

络(Deep

Neutral

Network,DNN)被广泛应用于时空

序列模型构建任务。SHI[211利用RNN模型的一个变

体,即长短时记忆(Long

and

Short

Term

Memory,

LSTM)

网络对地区的降雨量进行预测。CHE等人[221将传统

的RNN拓展到时空领域,提出时空递归神经网络

(

Spatio-Temporal

Recurrent

Neural

Network,

ST-RNN),

以对时空序列进行建模预测。类似地,在深度学习

方面,ZHANG等人[231将深度残差网络拓展到时空领

域,提出时空深度残差模型(ST-ResNet)以对人流量

进行预测。2算法描述2.1时空数据的奇异值分解SVD是一种矩阵分解技术,其在信号处理和统

计学中有很多应用[241o给定一个秩为l的时空数据

矩阵Yd

x

T,其中,D表示空间中观测点的个数,表示

第47卷第3期杨立宁,李艳婷:基于SVD和ARIMA的时空序列分解与预测55采样时间点的个数。时空数据矩阵Ydxt的奇异值分

解如下:Y

=

USV'

=

s1

u

1

v

1

+

s

2

u

2

v2

+

—+

sl

u

l

v

(

1)其中,U

=

(u

1,

u2,

—,

uj,

V

=

(v

1,

V2,

—,

vl),S

=

diag{sn

s2, —,

sl},且

s

1》s2》…》sl

A

0o

向量

u(i

=

1,

2,…,l)

是左奇异矩阵的列向量,向量vXi

=

1,

2,…,l)是右奇

异矩阵的行向量,标量亠称为奇异值。假设{c”:”

=

1,2,

—,

T}是矩阵Yd

x

T的列向量,”

代表给定的m时刻D中所有空间单元的观测值,YY'

表达了

D空间单元之间的相关性,这里假定Ydxt已

经去中心化为零均值矩阵。矩阵Ydxt的ui事实上是

相关矩阵YY'的特征向量,u

1表示相关矩阵YY'对应

特征值最大的特征向量,包含了空间相关性最多的

信息量,或被称为“空间模态”,表征了空间相关性的

模式。u

i的第j个分量Uj表示第j地区对第i空间模

态的“贡献”。类似地,假定{r”:”

=

1,鸟,…,。}是矩

阵Yd

x

t的行向量,”代表”位置在整个时间段的观测

值向量,Y

'Y表达了不同时刻之间的相关性,矩阵

Yd

x

T的v:事实上是相关矩阵Y

'

Y的特征向量,1表示

相关矩阵Y'Y对应特征值最大的特征向量,包含了

时间相关性最多的信息量,或被称为“时间模态”,表

征了时间相关性的模式。r;的第j个分量rj表示第

j时刻对第i时间模态的“贡献”。时空矩阵Yd

x

T分解

后的S是奇异值矩阵,i表示模式i的重要程度,例

如,若s

1是最大的奇异值,则s

1对应的模式1具有表

征空间模式的最重要的特征。2.2基于SVD的时空序列模型给定历史时空数据矩阵Yd

x(t

-1),对当前时刻t的

各个地理观测点进行预测的具体步骤如下:步骤1通过SVD对中心化后的时空矩阵进行

分解。假定历史时空数据矩阵Ydx(t-1)的秩为l,可利用

式(1)得到如下分解:YD

x

(t

-

1)

=

s 1

u 1

vj

+

s2

u

2 v2 +

…+

slu

l

v'l

(2)SVD有一个重要的性质,定义奇异值占比Er

=

還£r

=

si」,则当r

<<

l时,可达到85%以上的水平,剩余

£=

sii

=

1的可认为是噪声。因此,通过选取前几个奇异值与

对应的左奇异向量和右奇异向量进行重建,可以对

矩阵实现降噪,如下:YD

x

(t

-

1)

=

s 1

u 1

v1

+

s2

u

2 v2 +

…+

Sr

u

r

v'r

(3)步骤2通过ARIMA[251对时间模式进行建模预测。由于分解之后得到的右奇异向量v:可以看作时

间序列,因此本文利用时间序列中应用最广泛、效果

最好的ARIMA模型进行建模。ARIMA的标准模型

如下:V"vi,

t

=

P

+

01V"vi,

t-1

+

…+

0p

V"vi,

t-p +

£t

-01

£t

-

1

Oq

£t

-

q

(4)其中,VdVi,,代表t时刻第i个向量的d阶差分,t是t时

刻均值为0的随机误差,“、0(i

=

1,2,

—,p)=

1,2,

—,

q)为待估计参数。利用AIC、BIC信息准则和

最大似然法进行模型选择和估计,当得到估计好的

模型后,利用该模型进行h步向前预测,如下:vi,

t+h

=

01V"vi,

t+h-1

+

…+

0p

V"vi,

t+h-p +

£t

-01

£t

+

h

- 1

----------0q

£t

+

h

-

q

(5)步骤3利用SVD进行重建得到h步向前预测

结果。当得到时间模式的估计值后,利用已经存储的

奇异值和对应的左奇异向量重建时空矩阵,得到最

终预测结果:Yt

+

h

=

s

1

u

1

v1

t

+

h

+

s2

u

2

v2,

t

+

h

+

…+

sr

u

r

v'r.

t

+

h

(6)2.3模型优化模型优化包括奇异值选择和ARIMA模型参数选

择过程。针对奇异值选择,不同的奇异值个数重建的

矩阵精度不同,通常情况下,利用前几个较大奇异值即

可基本重构原始时空矩阵,剩余奇异值可理解为由数

据波动形成的噪音。本文通过遍历的方式验证了不同

的奇异值个数对最后效果的影响,最终设定对前2个

奇异值对应的时间模式进行建模。

针对时间模式

ARIMA模型的构建,首先需要对时间模式的平稳性进

行检验,若不平稳,需要将其转化为平稳模式并在后续

模型中逆推回真实预测结果;当数据平稳性检验通过

后,利用ARIMA模型对平稳时间模式进行建模,并利

用ACF和PACF图[251确定ARIMA模型中的p、d和q参

数取值;最后通过交叉验证以及信息准则AIC、BIC[261

对模型有效性进行检验并选择最优模型,在检验通过

后,利用得到的ARIMA模型完成预测。本文所提ST-

SVD算法描述如算法1所示,算法流程如图1所示。算法1

ST-SVD算法输入时空矩阵Yd

y_1),预测步长l输出D个基站的l步预测值1.

给定奇异值分解的阈值thre(本文设定为85%)2.

对丫。*

-

1)进行奇异值分解,得到U、S和V3.

利用阈值thre(85%)选择U、S和V中的有用成分4.

通过ARIMA模型对选定的V进行建模并根据AIC、

BIC选定最优ARIMA模型5.

利用最优ARIMA模型进行l步预测6.

将预测结果与选定的U、S进行乘积,重建D个基站的

预测值

56计算机工程2021年3月15日训练集:前160

h数据测试集:后56

h数据模型训练模型测试与性能比较根据训练得到的ARIMA模型

对后续时间行为进行预测1训练数据集~、奇异值分解右奇异矩阵F奇异值的累积

比重超过85%r|奇异值个数选择|利用左奇异矩阵和选择的

奇异值重构时空矩阵得到

预测结果K+i通过Bootstrap

提高预测精度模型评估,并与其他4种模型

进行比较(ARIMA、Lasso-VAR、

LSTM>

STARMA)利用

ARIMA

对右奇异

矩阵的每

一个时间

向量进行建模参数选择方法:AIC、BIC信息准则I

ARIMA

模型

输出模型评估结果

(指标为RMSE和MAE)图1

ST-SVD算法流程Fig.1

Procedure of

the

ST-SVD

algorithm3案例分析3.1数据集描述本文利用中国某大型城市的2

333个基站在

216

h(共9天)内的流量数据对所提ST-SVD算法进

成训练集和测试集,训练集包含前160

h的数据,测试集包含剩余56

h的数据行验证,数据的采集频率为1次/ho图2所示为

2

333个基站的相对位置布局,经纬度已经过处理,

—T表1所示为其中5个基站在13

h内的流量数据示例。

图3所示为3个基站在216

h内的流量变化情况,从

图3可以看出,基站3具有较明显的9个峰,表明基

站流量的变化基本以一天为周期,虽然另外2个基

站中基站1也存在较类似的峰值,但是两者的整体

变化有较大差异。本文将216

h内的流量数据拆分图2

2 333个基站的布局Fig.2

Layout of

2

333

ba

stations

第47卷第3期杨立宁,李艳婷:基于SVD和ARIMA的时空序列分解与预测表1

5个基站的部分历史流量数据片段Table 1

Partial

historical traffic data

fragments

of

five

ba

stations

57Kb日期时间13:00:0014:00:0015:00:0016:00:00基站

125

649基站

2262

041基站

3166

052206

333183 292基站

4223 005221

221235

454186

324基站

5469

4265

5852

91668126418

402312

000288

882206

590163

356677

779691

959559

721173 216136

5432014-03-0117:00:0018:00:0019:00:00109

47197

08154

12914

7258

119395

681356

533273

781125 79985

984117

155153

35217

87016

06620:00:0021:00:0010

1083

09033150

000流量的时空数据,距离越近相关性越大的假设并不

40

000§

30

000麗

20

00010

000成立。时间/h(a)基站1图4时间相关性矩阵Fig.4

Time

correlation

matrix时间/h(b)基站2350

000300

0005

250

000益 200

000J!

150

000100

00050

000图3

3个基站在9天内的流量情况Fig.3

Traffic

situation

of

three

ba stations

in nine

days图5相关性与空间距离的散点图Fig.5

Scatter

plot

of

correlation

and

spatial

distance3.2

ST-SVD模型构建ST-SVD模型构建步骤如下:步骤1通过奇异值分解对中心化后的时空矩

图6所示为排序后的奇异值,一般而言,前几个

奇异值即可涵盖大部分信息。从图6可以看出,前2个奇异值占据了奇异值之和的89%,因此,本文分

阵进行分解。在本案例中,时空矩阵Y的大小是

2

333x160,在进行数据预处理(异常值处理、平稳性

别构建一个奇异值的重建算法ST-SVD(1)和两个奇

异值的重建算法ST-SVD(2)。1412处理)之后,通过对处理后的Y进行奇异值分解,得

到左奇异矩阵、右奇异矩阵和奇异值。图4所示为

截取的时空矩阵Y的右奇异矩阵,即时空序列的时

o

10间模式,此处截取了一天内每个小时之间的相关性

情况,黄色区域表明相关性较强(彩色效果见《计算

机工程》官网HTML版),从图4可以看出,时间相关

1

……““

”"M性具有较明显的周期模式,并且可预测性较强。图5

所示为时空矩阵Y中不同地点的皮尔逊相关系数与

索引图6降序排列的奇异值距离之间的关系,从图5可以看出,针对该区域基站

Fig.6

Singular values

of descending

order

58计算机工程2021年3月15日表2模型拟合程度指标Table

2图7、图8分别对应前2个奇异值的左奇异矩

阵(空间模式)和右奇异矩阵(时间模式)。从中可

以看出,空间模式较为复杂,没有明显规律,但是时

vIndex of

model

fitting

degreeMAE0.010.00

RMSE0.020.01AICBIC-771.60间模式显示出

明显的周期性和可预测性。

因此,

文利用ARIMA模型分别对2个时间序列进行建模

v1-780.81卩2-1

143.43-1

118.83并预测。RMSE和MAE[271的计算公式分别如下:RMSE

=

J

D

f

f

(几

7)

it(9)MAE

=

D(10)步骤3利用境异值分解进行重建得到h步向

前预测结果。在得到t时刻时间模式的预测值v

1

t和

v,

t后,即可利用式(1)结合左奇异矩阵和奇异值重建

时空矩阵,得到t时刻空间各个位置的预测值。考虑

f

f

几-几

Fig.7

Left

singular

matrix0.2_0

2_____i______i______i_____i______i______i______i______i'0

20

40

60

80

100

120

140

160时间/h图8右奇异矩阵Fig.8

Right

singular

matrix步骤2通过AIC和BIC信息准则(表2)选择

ARIMA模型中的pd参数并得到下述结果:vit

=-0.072

6

+

1.635

1

v-0.5319

v、一2

-0.1964

V—

+

0.1509 e,

_

1

-0.545

0e一2

-

0.369

1

et-3

、、、(7)v2,

t

=

1.263

5

v2,

t-1

+

0.263

5

v?,t_2

+0.721

1

et

-1

-

0.721

1

et

-

2

(8)到流量的周期性一般为一天,因此,本文利用

ARIMA模型分别向前1步、向前6步、向前12步和向

前24步进行预测,并利用Bootstrap[281从2

333个基

站中抽取不同的样本量,从100次实验中取均值作

为最终结果,以评估算法在整个周期内不同预测长

度下的准确度和预测性能。3.3模型性能比较本文将ST-SVD(1)、ST-SVD(2)与现有常用的

ARIMA、Lasso-VAR,

LSTM

STARMA

4

模型进

行对比。其中,ARIMA模型并不是时空序列模型,

但是在不考虑空间观测点的相关性时时空序列变成

独立的多个时间序列,可以分别利用ARIMA进行建

模预测。ARIMA模型时间成本极高,但是可作为一

种基线模型进行对比。Lasso-VAR是带有Lasso正

则化约束的VAR模型,其认为时空模型是时间序列

模型加空间维度,即增加一维,然后通过传统的VAR

模型并添加Lasso正则化来降低过拟合风险。LSTM

是递归神经网络的变体,适用于时间序列,其与VAR

类似,将时空数据集的空间维度叠加到时间序列中

进行训练预测。STARMA模型是经典的时空分析模

型,本文采用欧氏距离定义模型中的空间权重矩阵。

实验过程中使用的软件、软件依赖包信息以及模型

关键参数如表3所示。表3实验过程中的软件、软件依赖包以及模型关键参数信息Table

3

The

software

‘software

dependency packages

and

key

parameters

information

of

the

model

during

the

experiment模型软件R语言R语言R语言软件依赖包forecastforecastforecast关键参数奇异值个数ST-SVD(1)ST-SVD(2)ARIMAARIMA模型参数p,q,ARIMA模型参数p,q,Lasso-VARMATLABPythoncvxkeras,tensorflow,pandas,numpy惩罚系数,模型阶数,系数矩阵网络层数,隐含层神经元个数LSTMSTARMAR语言starma空间权重矩阵,AR和MA阶数利用10个、20个、50个和100个基站160

h内的

数据分别对上述6种模型进行训练,并给出向前

1步、6步、12步和24步的预测结果,利用常见的预

测精度指标一均方根误差RMSE和绝对值误差

MAE对预测性能进行评估。由于本文案例中共有

2

333个基站,为了提高性能评估的准确性并降低

方差,通过Bootstrap在2

333个基站中随机选取上

述10个、20个、50个和100个基站100次,并对

100次的实验结果取平均值以作为最终的性能评估

结果。

47

3

期杨立宁,李艳婷:基于SVD和ARIMA的时空序列分解与预测59表4所示为上述6种模型向前1步的部分预测

结果,加粗数字为最优预测结果,括号中的百分数表

示预测百分比误差,计算公式如式(11)所示,表示

预测值,表示真实值。型需要足够多的样本来提高精度;STARMA模型优于

不添加空间信息的ARIMA模型;ST-SVD的2种模型

相较于其他4种模型预测准确率更优。具体地,利用

2个奇异值的ST-SVD(2)模型的预测误差约为0.13,

y

-

y

error

=--------

11y()ARIMA丄asso-VAR丄STM和STARMA的误差分别

约为

0.22、0.21、0.92和

0.19。ST-SVD(1)和

ST-SVD(2)

从表4可以看出:LSTM模型的预测精度最差,原

因是其数据量过少,模型欠拟合,这表明神经网络模

明显优于其他4种对比模型且ST-SVD(2)优于ST-

SVD(

1)。表4

6种模型的1步预测结果Table

4

One-step

prediction

results

of six

models序号真实数据ST-SVD(1)221

879(0.15)ST-SVD(2)218

495(0.17)150

575(0.09)ARIMALasso-VARLSTM24

386(0.91)STARMA12262

041166

052223

006469

427176

025(0.33)135

693(0.18)141 907(0.36)199

551(0.24)156

520(0.06)161

877(0.27)189

318(0.28)144

980(0.13)149

596(0.11)190

603(0.17)15

816(0.90)24

490(0.89)24

074(0.95)21

181(0.93)34193

918(0.15)401

761(0.14)159

213(0.29)403

218(0.14)258

275(0.19)708

781(0.23)564

155(0.16)1

056

788(0.13)826

613(0.21)360

880(0.23)225

828(0.27)377

502(0.20)239

820(0.22)708

834(0.23)509

532(0.24)372

671(0.21)237

912(0.23)830

233(0.10)610

391(0.09)1

034

435(0.15)567307

348915

579670

7361 212 8401

050

55526

273(0.17)745

144(0.19)626

856(0.07)811

109(0.11)35

440(0.96)30

228(0.95)22

153(0.98)26

960(0.97)27

723(0.80)599

095(0.11)1

085

398(0.11)886

153(0.16)98

968(0.30)89101

119

314(0.08)974

010(0.20)881

768(0.16)124

619(0.12)831

411(0.21)903

549(0.14)107

845(0.24)0.19141

078—123

028(0.13)0.16108

754(0.23)0.21平均误差0.130.220.92表5所示为上述6种模型在4种不同基站个数以

及4种不同预测步长情况下的RMSE,括号中为MAE。

对比模型,而且ST-SVD(2)的重构结果稍优于ST-SVD(

1)

的重构结果。从图9、图10可以直观地看出,2种ST-SVD

模型的误差低于其余4种对比模型。从表5可以看出,ST-SVD模型的性能明显优于其余4种

表5 6种模型在不同基站个数与预测步长情况下的实验结果Table

5

Experimental

results

of

six

models under

different

number

of

ba

stations

and

different

prediction

step

size预测步长基站数ST-SVD(1)109.31(84.21)ST-SVD(2)85.63(70.38)ARIMALasso-VAR67.21(54.27)125.37(97.29)LSTMSTARMA102083.26(75.15)134.29(101.44)125.34(81.21)102.21(67.23)341.56(218.38)346.25(221.30)282.31(172.35)231.55(140.64)293.53(180.42)294.82(187.31)245.19(152.76)200.37(126.38)255.37(161.36)231.43(161.28)211.57(131.65)112.35(73.17)162.84(121

.07)92.41

(78.23)125.31

(86.57)117.28(63.85)97.34(71.11)76.31(61.35)60.21(41.80)55.73(33.48)1步5081.70(51.65)65.37(38.12)207.32(101.21)147.34(102.54)162.54(120.02)213.39(100.62)232.41(117.34)232.36(140.37)242.28(190.21)352.17(210.56)284.31(177.48)275.13(175.39)239.25(166.18)309.12(192.31)300.51(200.34)232.49(148.12)212.43(136.76)76.21

(51 .31

)98.53(66.21

)10096.32(56.29)10206步202.31(100.42)191.42(98.45)162.74(86.34)135.75(74.41)234.65(108.28)226.52(249.56)312.84(152.37)317.47(138.19)263.16(80.74)188.94(100.43)162.25(90.23)143.89(76.45)50195.62(108.54)103.43(75.48)100217.65(94.31

)1020180.17(101.21)176.34(103.45)151.32(86.23)126.18(73.23)143.25(80.21)135.66(76.12)118.15(68.19)101.32(57.38)173.23(102.34)163.41(95.37)146.25(84.38)120.34(67.89)132.71(75.19)127.25(73.27)114.28(63.15)414.35(232.54)412.35(248.21

)334.52(200.98)240.17(145.29)265.37(172.53)234.04(1

53.42)12步50253.49(137.68)215.91(113.18)273.48(145.81

)1001020390.21

(241

.52)431.21(282.49)365.18(231.06)245.10(151.25)253.65(132.18)228.63(117.35)192.31(108.73)24步5010095.12(55.31)174.67(109.21)

60计算机工程2021年3月15日(a)向前1步预测(b)向前6步预测基站数(c)向前12步预测(d)向前24步预测图9

6种模型在不同基站个数与预测步长下的RMSEFig.9

RMSE

of

six

models under

different

number

of

ba stations

and

different

prediction

step

size-e-ST-SVD(l)模型

-B-ST-SVD(2)癮型

Y-ARIMA

檯型

-A-Lasso-VAR

模型

*LSTM模型

4STARMA模型-e-ST-SVD(l)模型

-B-ST-SVD(2)欖型

Y-ARIMA

癮麺

-A-Lasso-VAR

模型

*LSTM模型

ASTARMA

模型基站数(a)向前1步预测-e-ST-SVD(l)模型

-B-ST-SVD(2)欖型

Y-ARIMA

穰型

虫-Lasso-VAR模

*LSTM模型

-b-STARMA模型基站数(b)向前6步预测-e-ST-SVD(l)模型

-B-ST-SVD(2)欖型

-0-ARIMA

癮型

虫-Lasso-VAR模

*LSTM模型

4STARMA模型基站数

(c)向前12步预测

基站数(①向前24步预测图10

6种模型在不同基站个数与预测步长情况下的MAEFig.10

MAE

of six

models under

different

number

of

ba stations

and

different

prediction

step

size4结束语时空序列模型STARMA通过构建空间权重矩阵

来表征数据的空间相关模式,但是空间权重的构建大

多依赖距离等主观性因素,导致STARMA难以适用于

多数数据集。本文建立一种新的时空序列模型ST-SVD,

其利用SVD技术对时空数据集的时间模式和空间模

式进行自动分解,通过ARIMA模型拟合时间模式并建

模预测,最终重建出时空预测结果。ST-SVD模型不需

要对数据集的空间结构进行假设,只需对时间序列实

现建模,大幅降低了问题复杂度和模型训练成本。实

验结果表明,ST-SVD模型的预测效果优于LSTM、

第47卷第3期杨立宁,李艳婷:基于SVD和ARIMA的时空序列分解与预测61STARMA等时空序列模型。但是,本文研究尚存在一

定不足,一是ST-SVD认为空间模式是时不变的,即空

间作用和时间作用相互独立,二是在奇异值分解后的

时间序列建模中利用了较为传统的ARIMA模型,该模

型是一种线性模型,无法捕捉到时间序列中的非线性

模式。下一步将利用机器学习、深度学习等技术对时

间模式进行建模,然后通过奇异值分解重建时空序列,

以解决上述问题。参考文献[1

]

CRESS

IE

N,

WIKLE

C

K.

Statistics

for

spatio-temporal

data[M].

[S.

l.

]:

John

Wiley &

Sons,2015.[2

]

HUANG

H

C,

CRESSIE

N.

Spatio-temporal

prediction

of

snow

water

equivalent

using

the

Kalman filter

[

J].

Computational

Statistics

&

Data

Analysis,

1996,22(2):

159-175.[3

]

CRESSIE

N. The

origins

of

kriging

[J].

Mathematical

Geology,1990,22(3):239-252.[4

]

JONES

R

H,

ZHANG

Y

M.

Models

for

continuous

stationary

space-time

process

[M]//GREGOIRE

T

G.

Modelling

longitudinal

and

spatially

correlated

data.

Berlin,

Germany

:

Springer ,

1997

:

289-298.[5

]

MONTERO

J,

FERNANDEZ-AVILES

G,

MATEU

J.

Spatial

and

spatio-temporal

geostatistical

modeling

and

kriging[M].

[S.

l.

]:John

Wiley &

Sons,2015.[6

]

HOOPER

P

M,

HEWINGS

G

J

D.

Some

properties

of

space-time

process

[J].

Geographical

Analysis,

2010,

13(

3):

203-223.[7

]

OLIVER

M

A,

WEBSTER

R.

Kriging:

a

method

of

interpolation

for

geographical

information

systems

[J].

International

Journal

of

Geographical

Information

Systems

,

1990,

4(

3):

313-332.[8

]

CRESSIE

N,

JOHANNESSON

G.

Fixed

rank

kriging

for

very

large

spatial

data

ts[

J].

Journal

of

the

Royal

Statistical

Society:

Series

B(

Statistical

Methodology)

,

2008,70(1):209-226.[9

]

CRESSIE

N,SHI

T,KANG

E L. Fixed

rank

filtering

for

spatio-temporal

data[

J].

Journal

of

Computational

and

Graphical

Statistics,2010,19(3):724-745.[10]

NGUYEN

H,

KATZFUSS

M,

CRESSIE

N,

et

al.

Spatio­temporal

data

fusion

for

very

large

remote

nsing

datat[s

J]. Technometrics,2014,56(2) :

174-185.[11]

CLIFF

A

D,

ORD

J

K.

Space-time

modelling

with

an

application

to

regional

forecasting

[

J].

Transactions

of

the

Institute

of

British

Geographers

,1975(64):

119-120.[12]

MARTIN

R

L,

OEPPEN

J

E.

The

identification

of

regional

forecasting

models

using

space

: time

correlation

functions

[J].

Transactions

of

the

Institute

of

British

Geographers,1975(

66):

95-98.[13]

PATRICK

J

D,

HARVILL

J

L,

HANSEN

C

W.

A

miparametric

spatio-temporal

model

for

solar

irradiance

data]

J].

Renewable

Energy,

2016,87:

15-30.[14]

ANDRE

M,

DABO-NIANG

S,

SOUBDHAN

T,

et

tive

spatio-temporal

model

for

spatially

spar

global

solar

radiation

dat[a

J].

Energy,

2016,

111:

599-608.15]

ZHAO

Youlin,

GE

Liang,

ZHOU

Yijun,

et

al.

A

new

asonal

difference

space-time

autoregressive

integrated

moving

average

model

and

spatiotemporal

trend prediction

analysis

for

hemorrhagic

fever

with

renal

syndrome[

J].

PLoS

One,2018,13(11):518-526.[16]

BESSA

R

J,

TRINDADE

A,

MIRANDA

V.

Spatial-

temporal

solar

power

forecasting

for

smart

grids]

J].

IEEE

Transactions

on

Industrial

Informatics,

2015,

11

(1):

232-241.[17]

MESSNER

J

W,

PINSON

P.

Online

adaptive

lasso

estimation

in

vector

autoregressive

models

for

high

dimensional

wind

power

forecasting

[J].

International

Journal

of

Forecasting,

2019,35(

4)

1485-1498.[18]

BAHADORI MT,YUQ

R,LIU

Y.

Fast

multivariate

spatio­temporal

analysis

via

low

rank

tensor

learning

[

C]//

Proceedings

of Advances

in

Neural

Information

Processing

Systems.

Washington

D.

C.

,

USA:

IEEE

Press,

2014:3491-

3499.[19] BAROCIO

E,

PAL

B

C,

THORNHILL

N

F,

et

al.

A

dynamic

mode

decomposition

framework

for

global

power system

oscillation

analysis

[J].

IEEE

Transactions

on

Power

Systems,2015,30(6):2902-2912.[20]

LI

Yexin,

ZHENG

Yu,

ZHANG

Huichu,

et

al.

Traffic

prediction

in

a

bike-sharing

system[C

]//Proceedings

of

the

23rd

SIGSPATIAL

International

Conference

on

Advances

in

Geographic

Information

Systems.

New

York,

USA:ACM

Press,2015:33-39.[21]

SHI

Xingjian,

CHEN

Zhourong,

WANG

Hao,

et

al.

Convolutional

LSTM

network:a

machine

learning

approach

for

precipitation

nowcasting[EB/OL].[2019-11-10].

arxiv.

org/abs/1506.

04214.22]

CHE

Z

P,PURUSHOTHAM

S,CHO K,et

al.

Recurrent

neural

networks

for

multivariate

time

ries

with

missing

values

J].

Scientific

Reports,2018,8:6085-6090.[23]

ZHANG

J

B,

ZHENG

Y,QI

D

K.

Deep

spatio-temporal

residual

networks

for

citywide

crowd

flows

prediction[EB/

OL].[2019-11-10].

https

://arxiv.

org/abs/1610.

0

0081.24]

HOWARD

J

P.

Data-driven

modeling

&

scientific

computation:methods

for

complex

systems

&

big

data

EB/

OL].[2019-11-10].

www.

amazon.

com/Data-

Driven-Modeling-Scientific-Computation-Methods/dp/019

9660344.[25 ]

BROCKWELL

P

J,

DAVIS

R

A.

Fowcasting

techniques

[

M

]

//

S

HANMUG

AM

R.

Introduction

to

time

ries

and

forecasting.

Berlin,Germany:Springer,2016:309-321.26]

BURNHAM

K

P,ANDERSON

D

R.

Multimodel

inferenc[e

J].

Sociological Methods

&

Rearch,2004,33(2):261-304.[27]

WILLMOTT

C

J,MATSUURA

K.

Advantages

of

the

mean

absolute

error over the

root

mean

square

error

in

asssing

average

model

performanc

[e

J].

Climate

Rearch,2005,30: 79-82.[28 ]

RUBIN

D

B.

The

Bayesian Bootstrap

[J].

The

Annals

of

Statistics,1981,9(1):130-134.编辑吴云芳

基于SVD和ARIMA的时空序列分解与预测

本文发布于:2024-02-15 20:02:35,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/zhishi/a/1707998555249199.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

本文word下载地址:基于SVD和ARIMA的时空序列分解与预测.doc

本文 PDF 下载地址:基于SVD和ARIMA的时空序列分解与预测.pdf

标签:模型   时空   预测
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 实用文体写作网旗下知识大全大全栏目是一个全百科类宝库! 优秀范文|法律文书|专利查询|