stata笔记常用

更新时间:2023-11-10 00:08:44 阅读: 评论:0

帐篷节-官神吧

stata笔记常用
2023年11月10日发(作者:世界人口日)

stata笔记常用

Stata: 输出regression tablewordexcel

1. 安装estout。最简单的方式是在stata的指令输入:

ssc install estout, replace

EST安装的指导网址是:

2.跑你的regression

3.写下这行指令esttab using ,然后就会出现个漂亮的表

格给你(WORD文档)。只要再小幅修改,就可以直接用了。这个档

案会存在my documentstata下。如果你用打开的是一个stata do

file,结果会保存到do文件所在文件夹中。如果要得到excel文件,

就把后缀改为.xls或者.csv就可以了

4.跑多个其实也不难,只要每跑完一个regression,你把它取个

名字存起来:est store m1m1是你要改的,第一个model所以我

m1,第二个的话指令就变成est store m2,依次类推。

5.运行指令:esttab m1 m2 ... using 就行了。

异方差的检验:

Breusch-Pagan test in STATA

其基本命令是:estat hettest var1 var2 var3

其中,var1 var2 var3 分别为你认为导致异方差性的几个自变量。

是你自己设定的一个

滞后项数量。

同样,如果输出的P-Value 显著小于0.05,则拒绝原假设,即不

存在异方差性。

White检验:

其基本命令是在完成基本的OLS 回归之后,输入

imtest white

如果输出的P-Value 显著小于0.05,则拒绝原假设,即不存在异

方差性

处理异方差性问题的方法:

方法一:WLS

WLSGLS(一般最小二乘法)的一种,也可以说在异方差情形

下的GLS就是WLS。在WLS下,我们设定扰动项的条件方差是某个

解释变量子集的函数。之所以被称为加权最小二乘法,是因为这个估

计最小化的是残差的加权平方和,而上述函数的倒数恰为其权重。

stata中实现WLS的方法如下:

reg 1 2……

[aweight=变量名]

其中,aweight后面的变量就是权重,是我们设定的函数。

一种经常的设定是假设扰动项的条件方差是所有解释变量的某个

线性组合的指数函数。在stata中也可以方便地实现:

首先做标准的OLS回归,并得到残差项;

reg (被解释变量) (解释变量1 (解释变量2)……

predict r, resid

生成新变量logusq,并用它对所有解释变量做回归,得到这个回

归的拟合值,再对这个拟合值求指数函数;

gen logusq=ln(r^2)

reg logusq (解释变量1) (解释变量2)……

predict g, xb

gen h=exp(g)

最后以h作为权重做WLS回归;

reg 1 2……

[aweight=h]

如果我们确切地知道扰动项的协方差矩阵的形式,那么GLS估计

是最小方差线性无偏估计,是所有线性估计中最好的。显然它比OLS

更有效率。虽然GLS有很多好处,但有一个致命弱点:就是一般而言

我们不知道扰动项的协方差矩阵,因而无法保证结果的有效性。

方法二:HC SE

There are 3 kinds of HC SE

1Huber-White Robust Standard Errors HC1 其基本命令

是:

reg var1 var2 var3, robust

White1980

asymptotically valid)的。这种方法的优点是简单,而且需要的信

息少,在各种情况下都通用。缺点是损失了一些效率。这种方法在我

们日常的实证研究中是最经常使用。

2MacKinnon-White SE HC2,其基本命令是:

reg var1 var2 var3, hc2

3Long-Ervin SE HC3,其基本命令是:

reg var1 var2 var3, hc3

约束条件检验:

如果需要检验两个变量,比如x y,之间系

数之间的关系,以检验两者系数相等为例,我们可以直接输入命

令:

test x=y

再如检验两者系数之和等于1,我们可以直接输入命令:

test x+y=1

如果输出结果对应的P-Value 小于0.05,则说明原假设显著不成

立,即拒绝原假设。

序列相关性问题的检验与处理

序列相关性问题的检验:

首先,要保证所用的数据必须为时间序列数据。如果原数据不是

时间序列数据,

则需要进行必要的处理,最常用的方法就是:

gen n=_n

tst n

这两个命令的意思是,首先要生成一个时间序列的标志变量n(或

t 也可以);

然后通过tst 命令将这个数据集定义为依据时间序列标志变量n

定义的时间序

列数据。

最直观的检验方式是通过观察残差分布,其基本步骤是在跑完回

归之后,直接输

Predict error, stdp

这样就得到了残差值;然后输入命令:

plot error n

会得到一个error n 变化的一个散点图。

D-W检验——对一阶自相关问题的检验:

D-W检验是对一阶自相关问题的常用检验方法,但是如果实际问

题中存在高阶

序列相关性问题,则不能用这个检验方法。

D-W 检验的命令如下:

首先,输入回归命令,

reg Variable1 Variable2 Variable3…VariableM

输出一个简单的OLS估计结果。然后,再输入命令:

dwstat

这时会输出一个DW 统计量。通过与临界值之间的比较,可以得

出结论。也可

以执行如下命令

estat durbinalt

直接进行Durbin检验。

Breusch-GodfreyTest in STATA——检验高阶序列相关性:

在得到一个基本回归结果和error 之后,我们假设这样一个关

系:

et = α0 + α1 et-1 + α2 et-2 …+ αk et-p + β1 x1t + β2 x2t …

+βk xkt +εt

BG 检验的原假设是:H0 α1 = α2 = … αp =0。

其基本命令是:

bgodfrey , lags(p)

其中p 是你自己设定的一个滞后项数量。如果输出的p-value

著小于0.05,则

可以拒绝原假设,这就意味着模型存在p 阶序列相关性;如果输

出的p-value

著大于0.05 甚至很大,则可以接受原假设,即不存在p 阶序列

相关性。

处理序列相关性问题的方法——GLS

常用的几种GLS 方法:

1 Cochrane-Orcutt estimator Prais-Winsten estimator

其基本命令是

prais var1 var2 var3, corc

2 Newey-West standard errors

其基本命令是

newey var1 var2 var3, lag(3)

其中,lag3)意思是对三阶序列相关性问题进行处理;如果需

要对p 阶序列相

关性问题进行处理,则为lagp

t因变量,g,f,c是自变量,_26存放了弟26个观测值,为需要预

测的值

reg t g f c if _n!=26

点预测

predict taxpredict if _n==26

均值的区间预测

predictnl py=predict(xb),ci(lb ub) l(95)

因变量的区间预测

adjust g=117251.9 f=24649.95 c=99.9,stdf ci level(95)

Hausman检验是检验内生性的最常用的方法。它是通过比较一

致估计量与有效估计量的Wald统计量。

命令格式为:

.hausman name-constistent [name-efficent] [,options]

其中,name-cosistent指一致估计的结果, name-efficent 指有

效估计的结果。注意,一致、有效估计量的先后顺序不能改变。

Option选项:

constant 计算检验统计量将常数也包括在内,默认值为排除常数

allegs 利用所有方程进行检验,默认只对第一个方程进行检验

skipeqs(eqlist) eqlist只能以方程名称而不能以方程序号表示

equation(matchlist) 比较设定的方程。

force 即使假设条件不满足仍进行检验

df(#) 默认值为一致估计与有效估计的协方差矩阵的差的估计

sigmamore 协方差矩阵采用有效估计量的协方差矩阵

sigmaless 协方差矩阵采用一致估计量的协方差矩阵

tconsistent(string) 一致估计量的标题

tefficient(string) 有效估计量的标题

工具变量估计

命令格式:

.ivregress esitimator depvar [varlist1] [varlist2=varlist_iv]

[if] [in] [weight][,options]

其中,estimator包括2sls,gmm,liml三种。varlist1为模型中

的外生变量,varlist2为模型中的内生变量,varlist_iv为模型中的工

具变量。

Nonconstant 不包括常数项

Hascons 用户自己设定常数项

CMM 选项:

wmatrix(wmtype) robust,cluster clustvar,hac kernel,

unadjusted

center 权数矩阵采用中心矩

igmm 采用迭代GMM估计

eps(#) 参数收敛标准。默认值为epsle-6

weps(#) 权数矩阵的收敛标准。默认值为w eps(le-6)

Vce(vcetype) unajusted,robust,cluster

clustvar,bootstrap,jackknife,hac kernel

level(#)置信区间

First 输出第一阶段的估计结果

Small 小样本下的自由度调整

.estat firststage [,all forcenonrobust]

该命令给出第一阶段的估计结果以及各种统计量,包括排除外生

变量的相关性检验。All选项给出所有的拟合优度统计量。如果模型存

在多个内生变量,则stata给出R2、偏R2、调整的R2 F统计量;

如果模型存在多个内生变量,则stata给出SheaR2和调整的偏R2

forcenonrobust给出最小特征值统计量及其临界值,即使采用稳

健估计(这一检验的假设条件是误差项为独立正态分布)。

estat overid[,lag(#) forceweights forcenonrobust]

该命令给出了过度识别约束检验。如果使用2sls估计估计,则

StataSargan’s(1958)和Basman’s(1960)卡方统计量,这也是

Wooldridge’(1995)稳健得分检验。如果采用liml估计方法,则

stata给出Anderson and Rubin’s(1950) 卡方统计量以及Basmann

F统计量;如果采用GMM估计,则stata给出hann’s(1982)J

计量。Lags(#)用于计算得分检验的HAC(异方差自相关一致)统计量

的过程中进行去噪时设定滞后阶数。如果设定lag(0),则表示不进行去

噪处理。默认选择为lag(1)。这一选择仅使用于2sls估计方法和设定

vce(hac)选项情况。

Forceweight 表示即使采用aweights,pweightsiweights

进行检验。Stata仅对于fweights的情况进行检验,其他权数所得到

临界值可能不准确。

Forcenonrobust 指在2slsLIML估计中即使采用稳健标准差

也进行Sargan and Basmann检验(这一检验的假设的假设条件是误

差项为独立正态分布)。

例子:

log(wage)=a+b*educ+c*exper+d*expersq+u

怀疑模型教育(educ)具有内生性问题,利用父母接受教育的年

数(fatheduc,motheduc)作educ的工具变量估计上述模型。

1)利用2SLS估计模型

.ivregress 2sls lwage exper expersq (educ=fatheduc

motheduc),first

第一阶段回归结果为:

educhat=9.1+0.19fatheduc+0.16motheduc+0.05exper

(21.34) (5.62) (4.39) (1.12)

- 0.001expersq

(-0.84)

第二阶段的估计结果为:

lwagehat=0.05+0.06educ+0.04exper-0.001expersq

(0.12) (1.95) (5.29) (-2.24)

2)检验educ的内生性

.quietly ivreg iwage exper expersq {educ=fatheduc

motheduc}

.est store IV_reg

.quietly regress lwage exper expersq educ

.est store LS_reg

.hausman IV_reg LS_reg

可以得到hausman估计量=2.7P=0.44。接受原假设,即

educ是外生的。

(3)进行过度识别的约束检验

.estat overid

可得Sargan统计量=0.38P=0.54接受原假设。

面板数据估计

首先对面板数据进行声明:

前面是截面单元,后面是时间标识:

tst company year

tst industry year

产生新的变量:gen newvar=human*lnrd

产生滞后变量Gen fiscal(2)=

产生差分变量Gen fiscal(D)=

描述性统计:

xtdes :对Panel Data截面个数、时间跨度的整体描述

Xtsum:分组内、组间和样本整体计算各个变量的基本统计量

xttab 采用列表的方式显示某个变量的分布

Stata中用于估计面板模型的主要命令:xtreg

xtreg depvar [varlist] [if exp] , model_type [level(#) ]

Model type 模型

be Between-effects estimator

fe Fixed-effects estimator

re GLS Random-effects estimator

pa GEE population-averaged estimator

mle Maximum-likelihood Random-effects estimator

主要估计方法:

xtreg Fixed-, between- and random-effects, and

population-averaged linear models

xtregarFixed- and random-effects linear models with an

AR(1) disturbance

xtpc OLS or Prais-Winsten models with panel-corrected

standard errors

xtrchh Hildreth-Houck random coefficients models

xtivreg Instrumental variables and two-stage least squares

for panel-data models

xtabondArellano-Bond linear, dynamic panel data

estimator

xttobit Random-effects tobit models

xtlogit Fixed-effects, random-effects, population-

averaged logit models

xtprobit Random-effects and population-averaged probit

models

xtfrontier Stochastic frontier models for panel-data

xtrc gdp invest culture edu sci health social admin,beta

xtreg命令的应用:

声明面板数据类型:tst sheng t

描述性统计:xtsum gdp invest sci admin

1.固定效应模型估计:

xtreg gdp invest culture sci health admin techno,fe

固定效应模型中个体效应和随机干扰项的方差估计值(分别为

sigma u sigma e),二者之间的相关关系(rho)

最后一行给出了检验固定效应是否显著的F 统计量和相应的P

2.随机效应模型估计:

xtreg gdp invest culture sci health admin techno,re

检验随机效应模型是否优于混合OLS 模型:

在进行随机效应回归之后,使用xttest0

检验得到的P 值为0.0000,表明随机效应模型优于混合OLS 模型

3. 最大似然估计Ml

xtreg gdp invest culture sci health admin techno,mle

Hausman检验

Hausman检验究竟选择固定效应模型还是随机效应模型:

第一步:估计固定效应模型,存储结果

xtreg gdp invest culture sci health admin techno,fe

est store fe

第二步:估计随机效应模型,存储结果

xtreg gdp invest culture sci health admin techno,re

est store re

第三步:进行hausman检验

hausman fe

Hausman检验量为:

H=(b-B)′[Var(b)-Var(B)]-1(b-B)x2(k)

Hausman统计量服从自由度为kχ2分布。当H大于一定显

著水平的临界值时,我们就认为模型中存在固定效应,从而选用固定

效应模型,否则选用随机效应模型

如果hausman检验值为负,说明的模型设定有问题,导致

Hausman 检验的基本假设得不到满足,遗漏变量的问题,或者某些

变量是非平稳等等

可以改用hausman检验的其他形式:

hausman fe, sigmaless

对于固定效应模型的异方差检验和序列相关检验:

Xtrial gdp invest culture sci health admin techno

异方差检验:

xtreg gdp invest culture sci health admin techno,fe

xttest3 (Modified Wald statistic for groupwi

heteroskedasticity in fixed effect model)

随机效应模型的序列相关检验:

xtreg gdp invest culture sci health admin techno,re

Xttest1

Xttest1用于检验随机效应(单尾和双尾) 、一阶序列相关以及两者

的联合显著

检验结果表明存在随机效应和序列相关,而且对随机效应和序列

相关的联合检验也非常显著

可以使用广义线性模型xtgls对异方差和序列相关进行修正:

xtgls gdp invest culture sci health admin techno,

panels(hetero),修正异方差

xtgls gdp invest culture sci health admin techno,

panels(correlated),修正依横截面而变化的异方差

xtgls gdp invest culture sci health admin techno,

panels(hetero) corr(ar1),修正异方差和一阶序列相关ar(1)

学生会纳新问题-情绪是什么

stata笔记常用

本文发布于:2023-11-10 00:08:43,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/zhishi/a/1699546124211092.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

本文word下载地址:stata笔记常用.doc

本文 PDF 下载地址:stata笔记常用.pdf

下一篇:返回列表
标签:sq网址
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 实用文体写作网旗下知识大全大全栏目是一个全百科类宝库! 优秀范文|法律文书|专利查询|