投资模型

更新时间:2023-04-16 01:02:32 阅读: 评论:0


2023年4月16日发(作者:英语同桌)

投资组合优化模型

摘要

长期以来,金融资产固有的风险和由此产生的收益一直是金融投资界十分关

注的课题。随着经济的快速发展,市场上的新兴资产也是不断涌现,越来越多的

企业、机构和个人等都用一部分资金用来投资,而投资方式的多样性决定了人们

在投资过程中投资组合的多样性。而每一项投资在有其收益效果的同时也伴随着

风险性,所以不同的投资组合方式将带来不同的效果。对于不同类型的投资者必

然有不同的要求,从而适合不同的投资方式,所以意在建立在不同投资者的不同

要求下应采用哪种投资方式的模型,使投资者能做出正确的选择。

本文研究的主要是在没有风险的条件下,找出投资各类资产与收益之间的函

数关系,合理规划有限的资金进行投资,以获得最高的回报。

对于问题一,根据收益表中所给的数据,我们首先建立二元线性回归模型来

模拟收益U与x,y之间的关系,对于模型中的各项自变量前的系数估计量,利用

spss软件来进行逐步回归分析。发现DW值为0.395,所以原模型的随机误差项

违背了互相独立的基本假设的情况,即存在自相关性。为了处理数据间的自相关

问题,运用了迭代法,先通过Excel进行数据的处理和修正,达到预定精度时停

止迭代,再一次用spss软件来进行检验,发现DW值变为2.572,此时DW值落

入无自相关性区域。在进一步对模型进行了改进后,拟合度为进行了残差分析和

检验预测,这样预测出的结果更加准确、有效,希望能为投资者实践提供某种程

度的科学依据。

对于问题二,根据问题一建立的模型和问题二中所给出的条件,确定目标函

数,进行线性规划,用MATLAB软件来求得在资金固定的情况下,选择哪种投资

方式能使达到利益最大化。

最后,对模型的优缺点进行评价,指出了总收益与购买A类资产x份数和B

类资产y份数之间的关系模型的优点与不足之处,并对模型做出了适度的推广和

优化。

关键字:

经济效益回归模型自相关迭代法线性规划有效投资方法

1/22

一、问题重述

某金融机构选定了A,B两种投资品种,购买A类资产x份和B类资产y份的

投资收益是U,经分析测算有如下收益表:

U

3.7

5.4

6.6

7.4

10.2

10.7

12.5

13.2

14.4

14.1

17.6

18

16.6

19.4

19.3

18.7

19.6

2122

请解决以下问题:

2/22

A

2

3

4

5

6

12

20

30

40

47

100

120

125

240

100

80

130

170236

B

5

8

11

14

17

25

35

25

28

32

46

40

40

50

240

250

150

260270

(1)确定U与x,y的关系;

(2)若A的价格是每份120元,B的价格是每份80元,现有资金960万元,

选定有效的投资方案以使收益最大。

二、问题分析

对于问题一,根据实际中投资学的相关原理和有关常识,我们知道在同等无

风险的条件下,购买A类资产和购买B资产各自都会带来收益,因此,一般先确

定U与x、y之间的关系,有利于我们在决定投资时,如何分配对A,B两类资产

的投入资金的比重,这也是我们建立模型首先要解决的难点。

观察所给数据之间的大致关系来看,我们首先考虑建立回归模型,在进行数

据分析时,不可能通过几个简单的假设就监理处了一个完美的数学模型,这就需

要对现有的数据进行较为有效的筛选,在此次建模过程中我们一次进行了进行显

著性分析,进行逐个剔除,消除误差项之间的自相关性,进一步优化后,得到最

好的模型,再对结果分别进行预测和分析。

对于问题二,这是一个如何配置资源的问题,在已知目标函数的前提下,用

有限的资金来得到最大的利益。可以运用线性规划的相关知识来解决,列出所有

已知条件,即约束条件,并利用MATlAB软件来进行求解,得到最优解,最后进

行检验。

三、模型假设

1.投资者总是追求较高的收益,即投资者都是符合经济学中的“理性人”

的假设。

2.在短时期内所给出的平均收益率不变,即保证所得数据在一定时期内的

有效性。

3.假设题设中给的参数是准确值没有偏差。

4.存在无风险资产,即本文对A、B两类资产的投资都为无风险投资。

5.每种投资是否收益是相互独立的。

6.对收益率和风险的预测值是可信的

四、符号说明

3/22

U——收益

x——,购买A类资产的份数

y——,购买B类资产的份数

0

1

2

——分别为回归模型的常数项,自变量x、y前面的系数

i

——第i个样本回归模型的随机误差项

U

t

——第t个收益的回归估计

x

t

——第t个购买A类资产的样本份数

y

t

——第t个购买B类资产的样本份数

五、理论背景

1.多元线性回归

一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实

问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两

个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回

归。当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回

归。

设y为因变量X1,X2…Xk为自变量,并且自变量与因变量之间为线性关系时,

则多元线性回归模型为:

Y

i

=

0

+

1

X

1i

+

2

X

2i

+…+

k

X

ki

+

i

i=1,2,…,n

其中k为解释变量的数目,j(j=1,2,…,k)称为回归系数(regression

coefficient)。上式也被称为总体回归函数的随机表达式。它的非随机表达式为

E(Y∣X

1i

,X

2i

,…X

ki

,)=

0

+

1

X

1i

+

2

X

2i

+…+

k

X

ki

j

也被称为偏回归系数(partialregressioncoefficient)

建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效

果,应首先注意自变量的选择,其准则是:

(1)自变量对因变量必须有显著的影响,并呈密切的线性相关;

4/22

(2)自变量与因变量之间的线性相男人延时方法 关必须是真实的,而不是形式上的;

(3)自变量之间应具有一定的互斥性,即自变量之间的相关程度不应高于自

变量与因变量之因的相关程度;

(4)自变量应具有完整的统计数据,其预测值容易确定。

2、自相关的概念

如果模型的随机误差项违背了互相独立的基本假设的情况,称为自相关性。

对于模型

Y

i

=

0

+

1

X

1i

+

2

X

2i

+……+

k

X

ki

+

i

i=1,2,……,n

随机误差项互不相关的基本假设表现为:

Cov(

i

,

j

)=0i≠j,i,j=1,2,……,n

如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相

关性,则认为出现了自相关性。

在其他假设仍旧成立的条件下,序列相关即意味着

E(

i

,

j

)!=0

3、自相关性的后果

(1)参数估计量非有效

(2)变量的显著性检验失去意义

(3)模型的预测失效

4、自相关性的检验

杜宾-瓦森(Durbin-Watson)检验法

该方法的假定条件是:

(1)解释变量X非随机;

(2)随机误差项

i

为一阶自回归形式:

i

=

i-1

+

i

(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式:

5/22

Y

i

=

0

+

1

X

1i

+

k

X

ki

+Y

i-1

+

i

(4)回归含有截距项;

(5)没有缺失数据。

D.W.统计量

5、具有自相关性模型的估计

(1)广义最小二乘法

(2)一阶差分法

(3)广义差分法

(4)随机误差项相关系数的估计

科克伦-奥科特迭代法

首先,采用OLS法估计原模型

6/22

Y

i

=

0

+

1

X

i

+

i

得到的随机误差项的“近似估计值”,并以之作为观测值采用OLS法估计下

i

=

1

i-1

+

2

i-2

+

L

i-L

+

i

得到

1

,

2

,,

k

,作为随机误差项的相关系数

1

,

2

,,

k

的第一次估

计值。

其次,将上述

1

,

2

,,

k

,带入以差分模型

Y

i

-

1

Y

i-1

-……-

i

Y

i-1

=

0

(1-

1

-……-

i

)+

i

(X

i

-

1

X

i-1

-……-

i

X

i-1

)+ii=1,2,……,n

在此,将0,1代回原模型,计算出原模型随机误差项的新的“近似

估计值”,并以之作为模型

i

=

1

i

-1+

2

i-2

+……+

k

i-k

+

的样本观测值,采用OLS法估计该方程,得到

1

,

2

,,

k

作为相关系数

1

,

2

,,

k

的第二次估计值。

关于迭代的次数,可根据具体的问题来定。

一般是事先给出一个精度,当相邻两次

1

,

2

,,

k

的估计值之小于这一

精度时,迭代终止。

杜宾(Durbin)两步法

该方法仍是先估计

1

,

2

,,

k

,再对差分模型进行估计。

第一步,变换差分模型为下列形式:

Y

i

=

1

Y

i-1

+……+

l

Y

i-l

+

0

(1-

1

-……-

k

)+1(X

i

-

1

X

i-1

-……-

k

X

i-k

)+

i

i=1,2,……,n

采用OLS法估计该方程,得到各Y

j

(j=i-1,i-2,……,i-k)前的系数

1

,

2

,

k

的估计值

1

2

,……,

k

7/22

第二步,将估计的

1

,

2

,,

k,

代入差分模型

采用OLS法估计,得

0

(1-

1

-……-

k

),1的估计量,记为

*

0

*

1

六、模型建立

问题一:假定收益U与x、y之间存在线性关系,则可建立二元线性回归模

U=

0

+

1

*x+

2

*y+

式中,U表示总的收益;x表示购买A类资产的份数;y表示购买B类资产

的份数;0、1、2分别表示回归方程的常数项、x和y前面的系数;

表示随机误差项。

问题二:由上一问得到的模型U=9.042+0.047x+0.19y后,求目标函数的最大

建立约束条件:

120x+80y≤9600000

X≥0

Y≥0

式中,x、y表示的是整数。

8/22

七、模型求解及优化

1.问题一

(1)根据数据资料定义变量U(收益)、x(A类资产的份数)、y(B类资产

的份数),再将全部数据输入spss界面,建立数据文件。

(2)选择U为因变量,以x、y为自变量,进行逐步回归;在Statistics

对话框中选择Estimate、Modelfit、Discriptives、Durbin-Watson;选择Plots

对话框的残差直方图、残差正态概率图。并输出以ZRESID为X轴,以DPENDNT

为Y轴的散点图;在Save对话框里选择保存未标准预测值、未标准预测值残差、

标准预测值、标准预测值残差;Options对话框选项选择默认选项,各选项确认

以后,交系统运行。

(3)结果及分析

描述统计表如下:

9/22

DescriptiveStatistics

Std.

Deviation

5.6033772

77.147917597.2106593

MeanN

19

1919

U14.231579

x77.368421

y81.368421

表中显示各个变量的全部观测量的Mean(均值)、ion(标准差)和

观测量总数N。U的均值和标准差分别为14.231579、5.6033772,x的均值和

标准差分别为77.368421、77.1479175,y的均值和标准差分别为81.368421、

97.2106593。

(4)相关系数矩阵如下:

Correlations

PearsonCorrelation

Sig.(1-tailed)

N

U

U

1.000

.852

.725

.

.000

.00019

x

.852

1.000

.614

.000

.

.00319

y

.725

.614

1.000

.000

.003

.19

x

yU

x

yU

10/22

xy

1919

1919

1919

表中显示了三个自变量两两间的Pearson相关系数,以及关于相关系数关系

等于零的假设的单尾显著性检验概率。从表中看到因变量U(收益)与自变量x(A

类资产的份数)、y(B类资产的份数)之间相关系数一次为0.852、0.725,反应

它们之间有显著的相关关系,而可以看出在同等条件下,购买A类资产相比购买

B类资产的收益更大。

(5)回归系数表如下:

Coefficients(a)

UnstandardizedCoefficients

Std.

B

9.445

.062

9.042

.047.019

Error

.995

.009

.912

.011.008

Beta

.852

.653.325

B

9.492

6.704

9.911

4.5112.244

.000

.000

.000

.000.039

StandardizedCoeffici城市用英语怎么读 ents

ModeltSig.

1(Constant)

x

2(Constant)

xy

aDependentVariable:U

据表中数据费标准化系数B的数值可以知道,逐步回归过程中先后建立的两

个回归模型分别是:

模型1:U=9.445+0.062*x

模型2:U=9.042+0.047*x+0.019*y

11/22

0

=9.042,

1

=0.047,

2=0.019

(标准误)列显示的是各系数的估计标准误差。

从模型中可以看到,购买A类资产和购买B类资产对收益都起到正影响,因

为两个自变量前面的系数都为正数,这与假设分析一致,此投资为无风险投资。

(6)回归模型概述表如下:

ModelSummary(c)

Model

RSquare

.726.791

f

edRSquaretheEstimate

.709.765

3.02070482.7154146

RDurbin-Watson

.395

1.852(a)

2.890(b)

aPredictors:(Constant),x

bPredictors:(Constant),x,ycDependentVariable:U

回归模型概述表中给出了第一个模型中因变量U与自变量x之间的相关系数

R=0.852,说明变量U与x之间具有显著的线性关系。第二个模型中因变量U与x、

之间的复相关系数R=0.890,反映了变量U与x、y之间具有守望先锋黑影 高度线性关系。

对于第二个模型给出了杜宾-瓦特森检验DW=0.395,此时的

dl=1.08,du=1.53,因为0

由于回归模型存在序列自相关性,在此,我们用迭代法来处理。

U

t

=k

0

+k

1

xt+k

2

y

t

e

t

=*e

t-1

+u

t

U

’t

=U

t

-*U

t-1

12/22

x

’t

=x

t

-*x

t-1

y

’t

=y

t

-*y

t-1

其中,上式中的自相关系数p是未知的,可以由DW值做出估计p=1-1/2*DW,

计算后得出p的估计值为0.8025。

于是原式变为

U

’t

=

0

+

’1

*x

t

+

’2

*y

t

+u

t

(7)上式模型有独立随机误差项,它满足线性回归模型的基本假设,用Excel

做出有变换后的数据,并录入spss界面进行检验

由变换后的数据得出的回归模型概述表如下:

ModelSummary(c)

Std.

Errorofthe

Estimate

1.0569473.8975783

Model

12

R

.635(a).772(b)

AdjustedR

RSquareSquare

.403.596

.366.542

Durbin-Watson

2.572

aPredictors:(Constant),x

t

bPredictors:(Constant),x

t

,y

t

cDependentVariable:U

t

概述表中给出了第二个模型给出了杜宾-瓦特森检验DW=2.572,此时的

dl=1.08,du=1.53,因为dl

1

2

……

n

间存在正

自相关已经消除。

同时,我们可以观察到修改后的回归模型的残差值也基本在水平线y=0附近

随机分布

13/22

在此时自相关回归中,回归预测值Ut不是用k0+k1*xt+k2*yt计算,而是用

U

t

=k

’0

+*U

t-1

+k

’1

(x

t

-*x

t-1

)+k

’2

*(y

t

-*y

t-1

)

在上式为我们最终建立的模型,式中我们取收益表中的最后一组数据作为

xt-1和yt-1,即

U

t

=k

’0

+*U

t-1

+k

’1

(x

t

-*x

t-1

)+k

’2

*(y

t

-*y

t-1)

=9.042+0.8025*22+0.047*(x

t

-0.8025*236)+0.019*(y

t

-0.8025*270)人人体艺术摄影

=13.678845+0.047*x

t

+0.019*y

t

t统计量值和t分布的双侧显著性概率Sig.皆远小于0.05,可以认为回归系数

是显著的。

2.问题二:

根据问题一得到的模型和给出的已知条件,可以得到

目标函数:maxU=13.678845+0.047*x+0.019*y

约束条件:120x+80y<=960

14/22

x>=0y>=0

用MATLAB软件来求解线性规划的命令如下:

c=[-0.047-0.019];

A=[12080];

b=[9600000];

Aeq=[];

beq=[];

lb=[0;0];vb=[];

[x,fval]=linprog(c,A,b,Aeq,beq,lb,vb)

结果:x=

1.0e+04*

8.0000

0.0000

fval=

-3.7600e+03

并运用MATLAB还可以求出该模型的图像symsxyU

x=0:2:300;y=0:2:300;

15/22

U=13.678845+0.047*x+0.019*y;

[x,y]=meshgrid(x,y);

surf(x,y,U)

可得在A的价格是每份120元,B的价格是每份80元,资金960万元的条件下,

使收益最大时,应该将所有的资金960万元都用来买A类资产80000份,这是预计

的最大收益是3773.679。

八、模型检验

模型检验主要是针对问题一所提出的模型进行检验。

对回归系数的显著性检验,我们用的是t检验。

t检验:

在多元线性回归中,回归方程显著并不意味着美国自变量对U的影响显著,

16/22

所以需要对每个变量进行显著性检验。

如果某个自变量xj对作用不显著,那么在回归模型中,它的系数j就取

值为零。因此,检验变量是否显著,等价于检验假设

H

0j

:

j

=0,

j

=1,2,……,p

据此可以构造t统计量

t

j

=/√c

jj

其中是回归标准差。当∥t

j

∥≥t

/2

时,拒绝元假设H

0j

:

j

=0,认为j

显著不为零,自变量x

j

对因变量y的线性效果显著;当∥t

j

∥<t

/2

时,接受原

假设H

0j

j

=0,认为

j

为零,自变量x

j

对因变量y的线性效果不显著。

下图是回归系数表

Coefficients(a)

UnstandardizedCoefficients

Std.

Error

.995

.009

.912

.011.008

StandardizedCoefficients

ModeltSig.

B

9.445

.062

9.042

.047.019

Beta

.852

.653.325

B

9.492

6.704

9.911

4.5112.244

.000

.000

.000

.000.039

1(Constant)

x

2(Constant)

xy

aDependentVariable:U

图四川腊肠的做法 中的Sig即显著性P值,由x的P≈0.000,由此可知此自变量x显著,y

的P≈0.039,自变量y也显著。

17/22

由spss软件做出的残差统计表如下:

ResidualsStatistics(a)

Std.

PredictedValue

tedValue

StandardErrorofPredictedValue

AdjustedPredictedValue

Residual

al

al

DeletedResidual

dResidual

ceCook'sDistance

CenteredLeverageValueaDependentVariable:Ut

1.334061-1.4082221

-1.569

-1.621-1.5040683

-1.725

.139

.000.008

6.1220751.8736107美国枪战动作大片

2.087

2.1852.3974390

2.556

11.280

1.710.664

3.665045.0000000

.000

.028.0771谈判英文 220

.053

1.889

.132.111

1.2092543.8431280

.939

1.0321.0913442

1.096

2.977补肾吃什么药

.396.175

18

18

18

18

18

18

18

1818

.227

.761

.335

.153

18

Minimum

2.940604-.782

Maximum

6.0302492.233

Mean3.742167

.000

Deviation1.0247230

1.000

N

1818

本表显示预测值(PredictedValue)、残差(tedValue)、

标准化预测值(StandardErrorofPredictedValue)、标准化残差的最小值

(Minimum)、最大值(Maximum)、均值(Mean)、标准差(ion)

以及样本容量(N)。根据概率的3-原则,上图中标准化残差的绝对值的最大

值为1.569<3,说明样本数据中没有奇异数据,模型具有有效性。

残差分布直方图和观测量累计概率P-P图如下:

18/22

回归分析中,总是假设残差服从正态分布,残差分布直方图和观测量累计

概率P-P图就是根据样本数据的计算结果显示残差分布的实际状况,然后对残差

19/22

分布是否为正态的假设做出检验。

从回归残差的直方图与附在图上的正态分布曲线相比较,可以认为残差不是

很明显的服从正态分布。尽管这样,也不能盲目地否定残差服从正态分布的假设,

因为我们用来进行的样本量太小,样本容量仅为19.

观测量累计概率图,也是用来比较残差分布于正态分布差异的图形。

基于以上认识,从上图的散点分布状况来看,19个点大致散布于斜线附近,

因此可以认为此次分布基本上是正态的。

输出的图形中还有一个因变量的回归标准化残差图,如下所示:

对于问题二最优解的检验

由于x,y是正整数,且有约束条件120x+80y≤9600000,可知(x,y)的可行域

为图中的三角形区域中的整数点集,又由模型一代入最后一组数据而得到的函数

U=13.678845+0.047*x+0.019*y,

经变化可得到y=(-0.047/0.019)*x+(13.678845-U)/0.019

故当上式的截距取到最小值时,U为最大,此时的x与y值便是最优投资组合。

用MATLAB画出的图像如下

20/22

再者,由问题一建立的模型中,我们可以看到x前的回归系数为0.047,y前

面的回归系数为0.019,再由A的价格是每份120元,B的价格是每份80元,在不考

虑常数项的情况下,计算可得对于A的投资,每增加1元可得到的收益是0.0003917

而对于B的投资,每增加1元可得到的收益是0.0002375,所以我认为在资金有限,

不考虑风险的情况下,投资者应该先考虑投资A类资产,如果减去能购买A类最多

份数后的剩余的资金J,满足80≤J<120,则此时应该再考虑买一份B类资产。

关于最优解的检验,由于此题所给的可行域小,所以可以列出所有的可能性,

再代入目标函数进行检验,,但是对于多元的线性规划最优解,还是要建立相关

的矩阵,再来进行计算和检验。

九、模型评价及优化

模型的优点:

(1)本模型根据已有数据较好的体现了总收益与购买A、B类资产的份数之间

的关系,而且该模型简单易懂,使得求解有了考试检讨书 很大的简化。

(2)准确利用了题目所提供的数据,并对数据进行了较为透彻的分析,抓住

了分析的要点,较好的完成了数据的提取与应用。

(3)在本文中,我们分别用了spss、Excel、MATLAB等软件来进行数据的分

析和处理,这样有利于提高模型的准确度和预测的可信性。

21/22

模型的缺点:

(1)由于模型是建立在假设是确定值的基础上的而实际中0、1、2

常为随机变量因而模型在这个方面作的还不够,不能很好的抓住市场上的商机,

缺乏动态性。

(2)该模型没有考虑到各类投资的风险性,。

(3)实际中的各个项目之间往往是有相关性的其相关程度由相关系数来决定

模型的优化和推广:

将0、1、2作为随机变量来考虑,并进而考虑个投资项目之间的相

关性将是模型的一个主要改进方向,并把投资风险和损失及交易费等因素考虑进

模型。

十、参考文献

[1]郝黎仁樊元郝哲欧,《spss试用统计分析》,:中国水利水电,2002,

P217-P222。

[2]葛哲学,《精通MATLAB》,:电子工业,2008,P126-P127。

[3]何晓群X文卿,《应用回归分析》,:中国人民大学,2011,P56-P58,

P71-P72,P105-P115。

[4]韩中庚,《数学建模方法及其应用》,:高等教育,2005.6,P16-P18。

[5]赵静但琦,《数学建模与数学实验》,:高等教育,2003.6,P52。

22/22


本文发布于:2023-04-16 01:02:32,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/82/499020.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

上一篇:怡龙枫景园
标签:投资模型
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图