STATA 语法格式
1.选项
sysuse nlsw88,clear
【注意】一个语句只能有一个裸露在外的逗号
#注意下面语句里的第二个逗号是在括号里,不算裸露在外
twoway line close date, title("收盘价", place(left))
2. 变量引用
通配符:*,?,-
#多个连续变量的两种引用方式
#方法1:一一列举
sum age race married never_married grade
#方法2:写出首尾两个变量,中间以“-”连接
sum age-grade
sum s*
#【out】所有以s开头的变量
sum *s*
#【out】所有包含s的变量,无论s在开头,还是在末尾
sum ?a?e
# “?”只能代替一个字母
3. 因子变量
(1)“i.race”
sysuse nlsw88,clear
tab race
reg wage tenure i.race i.industry
# i.race 和 i.industry 分别产生race和industry的虚拟变量
#注意通过i.race 和 i.industry方式产生的虚拟变量,只是临时地参与回归,并没有在数据中产生
(2)连续变量:“c.age”
#第一种写法
reg wage tenure age c.age#c.age
#第二种写法
reg wage tenure c.age##c.age
(3)时间序列
①一阶差分、一阶滞后项,一阶forward
sysuse sp500,clear
tsset date
#由于原始数据中的date非连续,重新定义新变量"t",作为时间变量
gen t=_n
tsset t
# 生成一阶差分项
gen lnp = ln(close)
gen return = D.lnp
gen Lreturn = L.return
#一阶滞后项:用前一天的数据产生新变量
gen L2return = L2.return
#二阶滞后项
gen Freturn = F.return
gen F2return = F2.return
②回归中的两种等价写法
写法一
sysuse sp500,clear
tsset date
gen t=_n
tsset t
gen lnp = ln(close)
gen return = D.lnp
gen Lreturn = L.return
gen L2return = L2.return
reg return Lreturn L2return
写法二
sysuse sp500,clear
tsset date
gen t=_n
tsset t
gen lnp = ln(close)
gen return = D.lnp
reg return L(1/2).return
#不生成滞后变量,只在回归时临时使用数据