stata基本指令

Stata数据分析：命令详解与操作实例

原创已于 2024-05-11 21:56:52 修改 · 4.1k 阅读

21 ·

CC 4.0 BY-SA版权

文章标签：

#statistics #数据分析

于 2021-12-02 20:42:48 首次发布

stata 专栏收录该内容

1 篇文章

订阅专栏

//写在前面：做笔记用

切换数据集一定要用clear！！

命令结构:
[by varlist:]command [ ] [ ] [ ] [,option] //“，”是可选项的意思，但还是不太明白和前面不带都逗号的区别

log uising “”
set more on //显示开头，自己翻页
set more off

审视数据

d //查看所有变量名称及类型
list s lnw //查看某一变量数据
list s in 1/5 //1/5表示[1,5] 用斜杠表示很新颖！
     |  s |
     |----|
  1. | 12 |
  2. | 16 |
  3. | 14 |
  4. | 12 |
  5. |  9 |
     +----+
//排序
sort s
list s
gsort -s //gsort “-”倒序
list s

数据计算gen+运算命令

在这里插入图片描述

图片来自于《stata软件教程（人大十八讲）》

拓展：gen与egen 生成逻辑变量

gen y=sum(tenure)//列表显示：累积求和
list y
egen z=sum(tenure)//一列全是sum
list z
gen p1=(price>=.27) //生成逻辑变量（虚拟）

结果：
在这里插入图片描述

统计分析

sum x[,detail] //",d"查看细节

 sum s
 

    Variable |        Obs        Mean    Std. Dev.       Min        Max
-------------+---------------------------------------------------------
           s |        758    13.40501    2.231828          9         18
sum s,d //d(detail详细的描述性统计
(分位数)

tabulate price //经验分布函数，显示频率、百分比和累计百分比

. tabulate price //经验分布函数，显示频率、百分比和累计百分比

      price |      Freq.     Percent        Cum.
------------+-----------------------------------
        .26 |          1        3.33        3.33
       .262 |          1        3.33        6.67
    ……略
       .287 |          3       10.00       96.67
       .292 |          1        3.33      100.00
------------+-----------------------------------
      Total |         30      100.00

相关系数矩阵pwcorr

[,sig star]


. pwcorr consumption price income temp,sig star(.05)

             | consum~n    price   income     temp
-------------+------------------------------------
 consumption |   1.0000 
             |
             |
       price |  -0.2596   1.0000 
             |   0.1660
             |
      income |   0.0479  -0.1075   1.0000 
             |   0.8014   0.5719
             |
        temp |   0.7756* -0.1082  -0.3247   1.0000 
             |   0.0000   0.5692   0.0800
             |

//相关系数：“pwcorr”表示“pairwise correlation”(两两相关)，
//“sig”表示显示相关系数的显著性水平(即p 值)。
//star(.05)”表示给所有显著性水平小于或等于 5%的相关系数打上星号。