1.简单画图
(1)直方图(红色表示可简写)
采用 histogram 命令, 连续经验分布图可采用核密度估计 kdensity
histogram v, width(组宽) frequency (可选,将纵坐标定为频数)
kdensity v
(2)散点图
采用 scatter v1 v2
标注观测,可采用新生成顺序变量 gen n= _n (第n个观测值),sc v1 v2,mlabel(n) mlabpos(6)
加回归线采用 qfit v1 v2
scatter water gsp
gen n=_n
scatter water gsp,mlabel(n) mlabpos(6)
twoway (scatter water gsp) (lfit water gsp)
2.生成新变量
采用generate,对变量v取对数,取平方可采用以下操作
g lnv=log(v)
g v2=v^2
注意0-1变量的取法,假如将年龄(age)大于30岁的取1,否则取0,则可以采用
g v=(age>=30)
表示当括号为真,逻辑判断为1,否则取0
变量删除、重新命名可采用
drop v
drop ln*
rename v1 v2
分别表示删除v变量,删除所有 ln 开头的变量,将变量名v1改为变量名v2
3.计算功能
采用“display 计算式” 命令
di log(5)
di 8+2*3
di normal(1.96)
di normal (1.96 ) 表示计算标准正态变量小于1.96的概率