Stata基础33讲(连享会公开课)

更新时间:2023-06-17 00:10:58 阅读: 评论:0

Stata基础33讲(连享会公开课)A. 课程概述
Stata = statistics + data(统计分析+数据处理)
为何选择Stata?
1. Stata数据处理功能强⼤、快捷,提供了⼤量的函数;
2. Do-files ⾮常便利,帮助⼀次性执⾏多条命令,使实证分析⼯作具有可重复性;
3. 绘图精美;
4. 更新快、平台宽,保证研究⼯作与时俱进。
LY_Stata⽂件夹放置了本课程所有资料(放置路径)
1. data——范例数据
2. plus——使⽤到的所有外部命令
3. Refs——使⽤到的所有参考⽂献
要求得到的英文
4. Resu lts——统计和回归分析的结果heron
B. Stata 简介(Basic)
B1 Stata概览
【ado】
1. ba⽂件夹——官⽅命令背后对应的ado⽂件和说明⽂件
2. updates⽂件夹——定期更新后的辅助⽂件存放
3. plus⽂件夹——Stata插件
4. personal⽂件夹——⾃⾏建⽴,存放个⼈⽂件,建⽴专题,学会整理
【菜单栏】的使⽤
1. 【⽂件】-【导⼊】把不同格式数据转换成Stata格式;
2. 【⽂件】-【⽰例数据集】,有官⽅⽰例数据;
3.  想要再次执⾏命令时可双击【历史窗⼝】中的备份指令;
4. 【编辑】-【⾸选项】或【右键】-⾸选项or字体;可以【保存⾸选项设置】,在【加载⾸选项设置】处可直接选⽤,若操作中需要使
⽤中⽂⽂字,则需要将【加粗】前的勾全部去掉;
pushback
5. 【Help】中PDF documentation是Stata的电⼦⼿册,很有帮助。
【 Do-file Editor】的使⽤(常⽤+重要)
1. 打开⽂件 eg课程讲义;
2. 所有在【命令窗⼝】 输⼊的命令都可以集合写在【 Do-file Editor】⾥,有助于⼯作的延续性和保存复盘;
3. 在【 Do-file Editor】中,开头带【*】的叫【注释语句】,可以添加⽂字说明;
4. 执⾏命令,既可以到【命令窗⼝】执⾏,也可以在【 Do-file Editor】选中,点击【Do】;
5. 在【 Do-file Editor】执⾏命令,可⼀次性选中多个命令,⼀次执⾏出来;
6. 【sysdir t PLUS "D:\Stata MP 16\ado\plus" / / sysdir t PERSONAL "D:\Stata MP 16\ado\personal"】///更改系统⼯
作、存储路径
7. 【sysdir】 // 可以查看系统⽂件的放置位置
8. 【help <;指令> 】 // ⽤于查看指令的详细信息
9. 【ssc install <;指令>】 // ⽤于当找不到指令时,安装外部指令
B2 Stata⽂件路径
B2.1 当前⼯作路径
Stata的⼯作原理是从硬盘上调取⼀份数据,存⼊内存后经过⼀系列统计与回归分析运算,把相应结果输出的同时,也可另存⼀份数据到硬盘上。因此,要清楚的告诉Stata数据从哪个地⽅读取,结果存储到哪⾥。
Stata的左下⾓显⽰当前⼯作路径,如果使⽤【u】调⽤数据,则默认从该⽬录下调⼊数据
【cd "<;指定路径>"】进⼊到我们指定的某个命令路径之下(例如,cd "D:\  ");
【cd <;指定⽂件夹名称>】以当前⼯作路径为基础,进⼊到⼦⽬录⾥⾯(例如,cd _data)
【dir】显⽰当前⼯作路径下的⽂件信息
【cdout】打开当前⼯作路径对应的⽂件夹,进⼊windows操作界⾯
agila【u "GTAs_2008.dta", clear】  //从当前⼯作路径下读⼊数据 "GTAs_2008.dta"
*等价命令:
①【u "D:\Stata MP 16\ado\LY_stata\_data\GTAs_2008.dta", clear】完整路径下读取数据
②【global path "D:\Stata MP 16\ado\LY_stata"  //全局载元,[P2_local]篇详细介绍    u "$path\_data\GTAs_2008.dta",
clear】引⽤载元名称后再写上⽂件名称,就可以调出数据
B2.2 ⽂件和⽂件夹的管理
【pwd】显⽰当前⼯作路径在结果窗⼝,可复制了
【expl】 Explore folders and files外部命令,很好⽤, 显⽰⼀系列包含链接的⽂件信息,点击链接可打开相应的⽂件夹/⽂件,该命令可很好的管理⽂件夹和⽂件;
【lall】list all ,列举当前⼯作路径下的⽂件和⽂件夹,[view]浏览⽂件,[edit]编辑⽂件,[do]执⾏do⽂档
循环语句,批量修改⽂件名称(例如,问卷调查得到的问卷数据名称)
1 help fpref    //在⽂件名中批量添加前缀或后缀
2 help fren      //批量修改⽂件明中字段
3 help renfiles  //批量修改⽂件名
B2.3 stata 的系统⽂件设定
【sysdir】 // 可以查看系统⽂件的放置位置,system+dir
1 sysdir
2  STATA:  D:\Stata MP 16\
3    BASE:  D:\Stata MP 16\ado\ba\
4    SITE:  D:\Stata MP 16\ado\site\
5    PLUS:  D:\Stata MP 16\ado\plus\
6PERSONAL:  D:\Stata MP 16\ado\personal\
7OLDPLACE:  D:\Stata MP 16\ado\personal\_myado\
8
命令执⾏过程,stata只能识别存放于这些⽂件夹下的程序⽂件
ded1. 从BASE⽂件夹中找⼀个同名的ado⽂件,找到则执⾏;
2. 若BASE中没有,则在UPDATES中寻找;
3. 若UPDATES也没有,则在PLUS中寻找;
4. 若以上⽬录均找不到,则Stata输出⽆法识别命令。
【adopath】  //为Stata增加信任路径,即添加了可识别程序⽂件  adopath + "D:\Stata MP 16\ado\LY_stata\_plus"
【Stata开机⾃启动基本设定】如何设定? profile ⽂档
(1)将以下指令保存⾄Stata的根⽬录下,并命名为profile.do
1*-基本参数设定
gj什么意思2      t type double          // 后续产⽣的变量都将是双精度型的,有助于做拟合分析
3      t memory 50m          // 为 stata 分配 50M 内存
4      t matsize 2000        // 矩阵维度
5      t scrollbufsize 50000  // 设定屏幕的最⼤显⽰⾏数moderately
6      t more off, perma      // 不分屏显⽰
7
8    *-log ⽂件设定
9      log using    " D:\Stata MP 16\ado\personal\stata.log", text replace
10      cmdlog using " D:\Stata MP 16\ado\personal\command.log", append
11
12    *-⽂件⽬录设定
13      sysdir t PLUS    "D:\Stata MP 16\ado\plus"    //外部命令的存放地址
14      sysdir t OLDPLACE "D:\Stata MP 16\ado\personal\_myado"
15      sysdir t PERSONAL "D:\Stata MP 16\ado\personal" //个⼈⽂件夹
16
17    *-ado⽂档查找路径
18      adopath + "D:\Stata MP 16\ado\personal"
19      adopath + "D:\Stata MP 16\ado\personal\_myado"
20
21    *-指定默认⼯作路径
22      cd "D:\Stata MP 16\ado\personal"deep
(2)关闭 stata 并重新打开, 如果设定⽆误, 则屏幕上应该显⽰如下信息:
*    running D:\Stata MP 16\profile.do ... (成功导⼊基本设定)
(3)还可以在profile⽂件中加⼊以下命令来确定每次启动时运⾏的盘符
1dis _n(30)
2if "`c(sysdir_stata)'" == "D:\Stata MP 16/" | "`c(sysdir_stata)'" == "d:\Stata MP 16/"{
3 local D "D"
4}
5el{
6 dis in w "请在command窗⼝输⼊Stata所在的盘符,按回车键:______"
7 dis in w "Here is my Stata: " _request(isD)
8 local D "$isD"
9}
(4)在profile⽂件中加⼊以下指令,来⾃动以当前⽇期命名log⽂件 并存放于Stata\do ⽂件夹下
1cap cd `c(sysdir_stata)'do
2if _rc{
3 mkdir `c(sysdir _stata)'do
4}
5local fn = subinstr("`c(current_time)'",":","",2)
6local fn1 = subinstr("`c(current_date)'"," ","",3)
7log using `c(sysdir_stata)'do\s`fnl'`fn'.log, text replace
8cmdlog using `c(sysdir_stata)'do\c`fn1'`fn'.log, replace
9
10* cd `D':\Stata MP 16\ado\personal // Stata启动后⾃动进⼊该⽬录
11cd `c(sysdir_personal)'
B3 stata命令的语法格式
B3.1 简介
help summ
调⼊数据
困难的英文
sysu nlsw88, clear
【sysu】 和 【webu】都是 【u】 命令的拓展命令,sysu ⽤于从Stata的内置数据库中调取数据,webu⽤于从⽹络上调取数据。
多数命令和选项都可以简写
1    sum wage            // 直接针对某个变量计算基本统计量
2    sum wage if race==1  // if 限定样本,==进⾏逻辑判断是否相等,=代表赋值
3    sum wage in 1/10    // in 很少⽤,前⼗个观察值
4    sum wage, detail    // 选项,灵活性
【bysort】前缀类型
例②不但根据婚姻状况,还进⼀步根据学历情况,去做⼯资和时间两个变量的基本统计量
1    bysort race: sum wage hours age  //前缀写法,通过race分类,计算所列基本统计量
2 bysort marr collgrad: sum wage hours
B3.2 Stata 的⼀般语法格式
help language
【summarize】可以有选择地填⼊其中⼀项或多项,例如是否填变量名称,⼀个或多个/限定样本范围/观察值范围/options选项设定拓展功能
1 summarize [varlist] [if] [in] [weight] [, options]
2前缀[prefix:] cmd [varlist] [=exp] [if] [in] [using filename] [, options]
Note: 【options】通过逗号分割,⽆论多长,整条命令只能有⼀个裸露在外的逗号,逗号后为 options,    *-e.g. 1  【gen】是取对数⽣成新变量,【tabstat】是描述性统计分析
1 sysu nlsw88, clear
2 gen lnwage = ln(wage) // 对变量取对数,⽣成新变量
3 gen yes_white = (race==1)  // [=exp]
4 tabstat lnwage hours married age, by(yes_white) s(mean) f(%3.2f) //逗号前是变量,后⾯选项
*-e.g. 2 绘制标准普尔500指数,某年份的收盘价价格⾛势伦敦奥运会时间
1  sysu sp500, clear
2  twoway line clo date, title("收盘价", place(left))
第⼆⾏的第⼀个逗号前为指定变量和绘图类型,后⾯⼀个逗号包含在指定选项options(图形title)内,并未裸露在外。
B3.3 变量的引⽤

本文发布于:2023-06-17 00:10:58,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/90/147556.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:命令   数据   路径   选项   变量   设定   件夹
相关文章
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图