STATA学习笔记:缺漏值的处理STATA学习笔记:缺漏值的处理
1. 缺漏值的标记
stata中缺漏值默认标记为"."
女性冬季服装".“是数值,且是⼀个⼤于任何⾃然数的数值
【注意】
sum、generate等命令,会⾃动忽略缺漏值
count、keep等命令,会将缺漏值”."视为⽆穷⼤的⼀个数值
epox
2.将其他缺漏值的标记转化为"."
端午节英语作文mvdecode命令
提交英语常见缺漏值的标记
N.A.
N/Afite
-99
-97
-9999
匈牙利语英文import delimited using ""
//使⽤import delimited命令导⼊txt格式数据
变量x1 x2中含有数值型缺失值
变量x3中含有字符串型缺失值
(1) 数值型数值型缺失值转化为"."
mvdecode x1 x2,mv(-97-999)
(2)字符串型缺失值转化为"."
replace x3 ="."if x3 =="N/A"
destring x3, replace
pioneer是什么意思3. 使⽤不包含缺失值的样本
sysu nlsw88.dta, clear
sum wage industry tenure grade
sum 命令的结果显⽰wage industry tenure grade 变量的观测值个数不同,即每个变量包含了不同个数的缺失值reg wage industry tenure grade
reg 命令结果显⽰参与回归的观测值只有2215个,回归使⽤的样本中不包含缺失值
6s是什么意思
问题是如何筛选出不包含缺失值的样本?
命令 ==ereturn ==
ereturn: Post the estimation results
ereturn list : List e() stored results
ereturn list
函数e(sample)
e(sample)
Description: 1 if the obrvation is in the estimation subsample and 0 otherwi
tobehonestsum wage industry tenure grade if e(sample)==1
//e(sample)有两个值:0和1
//1表⽰对应⾏观测值参与回归
添加if e(sample)==1条件之后,sum命令统计的观测值个数和参与回归的观测值个数⼀致,即剔除了wage等四个变量中的缺失值
overridegen yes =e(sample)
sort yes
brow yes wage industry tenure grade
4.删除缺失值
keep if yes==1