一、基础操作篇:数据导入与清洗
1. 数据导入与导出
use filename.dta
加载Stata格式数据import excel using data.xlsx
导入Excel文件export delimited using data.csv
导出为CSV格式webuse auto
调用Stata内置数据集(如auto汽车数据集)
2. 数据清洗
duplicates drop var1 var2
删除var1和var2重复的观测drop if age<18
剔除年龄小于18的样本replace salary=0 if missing(salary)
将缺失值替换为0egen newvar=rowmean(var1 var2)
生成var1和var2的行均值新变量
二、统计分析篇:从描述到建模
1. 描述性统计
summarize var1 var2
输出均值、标准差等基础统计量tabstat var1, stat(mean sd min max)
自定义统计指标输出corr var1 var2 var3
计算变量间相关系数
2. 回归分析与检验
reg y x1 x2 x3
普通最小二乘法回归xtreg y x1 x2, fe
面板数据固定效应模型esttab using result.rtf
将多个回归结果导出为Word表格vif
检验多重共线性
三、高阶应用篇:效率提升技巧
1. 数据可视化
histogram var1
绘制直方图scatter var1 var2
生成散点图graph bar var1, over(group)
分组柱状图
2. 批量处理与编程
forvalues i=1/10 { reg y x
i' }` 循环运行10次回归ssc install winsor2
安装数据缩尾处理插件doedit mycode.do
编辑并执行脚本文件
3. 面板数据专题
xtset id year
声明面板数据xtserial y x1 x2
检验面板自相关hausman fe re
固定效应与随机效应模型选择
四、实操案例演示
场景:分析上市公司业绩影响因素
- 数据清洗:
drop if missing(roe) // 删除ROE缺失样本 winsor2 assets, cut(1 99) // 对资产变量进行1%缩尾处理[3]()
- 描述统计:
tabstat roe growth, by(industry) stat(mean sd) // 分行业统计[6]()
- 回归建模:
xtset stkcd year // 声明面板数据 xtreg roe size leverage growth, fe // 固定效应模型[7]()
五、学习资源推荐
- 📚 教材:《应用STATA做统计分析》配套实操案例
- 📺 课程:B站"Stata从入门到放弃"系列教程(搜索播放量50万+)
- 💻 插件库:使用
ssc install 命令名
安装空间计量、机器学习等扩展包
立即动手试试这些命令,让数据分析效率提升200%!🚀