- 博客(20)
- 收藏
- 关注
原创 《Stata面板数据分析:数据检验、回归模型与诊断技术 - 以NLSW工资研究(公开数据)为例》
本教程通过NLSW数据集详细讲解Stata面板数据分析方法,包括数据准备、三种基础模型(混合OLS、随机效应和固定效应)的估计与比较,以及模型选择检验和诊断检验。重点介绍了Breusch-Pagan、Hausman和F检验的运用,分析了异方差和序列相关问题,并演示了聚类稳健标准误的处理方法。教程还提供了模型结果对比和进阶研究方向的建议,帮助研究者根据实际问题选择合适模型并处理内生性等复杂情况。
2025-07-10 18:13:54
1023
原创 内生性、外生性与工具变量:一杯咖啡里的经济学
内生性问题是指回归模型中解释变量与误差项相关,导致OLS估计结果偏差。常见原因包括遗漏变量、测量误差和逆向因果关系。工具变量(IV)是解决内生性的有效方法,需满足相关性(与内生变量强相关)和外生性(与误差项无关)两个条件。弱工具变量(相关性不足)会导致估计不稳定。常用IV估计方法包括2SLS、LIML和GMM等。选择合适工具变量需结合理论支撑和统计检验,如F检验和Sargan检验。
2025-07-10 16:30:49
1152
原创 单位根检验的目的及 Stata 教学示范:面板数据与横截面数据的区别
单位根检验是时间序列分析和面板数据分析中的重要步骤,其主要目的是判断数据是否具有平稳性。通过单位根检验,我们可以确保数据的平稳性,从而为后续的模型分析打下坚实基础。:如果 p 值小于显著性水平(如 0.05),拒绝 0H0,说明序列是平稳的。:均值、方差和自协方差在时间上保持恒定,序列的统计特性不随时间变化。:允许截面单元具有不同的单位根过程,更适合异质性较大的面板数据。:允许更一般的误差结构,适合处理异方差和序列相关的误差项。:如果 p 值小于显著性水平,拒绝 H0,数据是平稳的。
2025-05-29 15:02:50
714
原创 【小菲stata】毕业论文: Stata面板数据全流程分析指南
1. **数据预处理** → 2. **共线性检验** → 3. **基准回归** → 4. **稳健性检验** → 5. **内生性处理** → 6. **异质性分析**- 行业/地区固定效应加`i.industry`或`i.region`addnotes("聚类标准误在个体层面,*** p<0.01")- 若存在单位根,需做**一阶差分**:`gen dy = D.y`- **p<0.05** 拒绝"存在单位根"的原假设。**🔍 一、数据预处理(必做步骤)****📉 四、面板单位根与协整检验**
2025-05-12 23:07:24
762
原创 Stata又双叒叕‘偷吃’数据了?背后真相竟是这样!
最近在跑回归模型的时候,发现一个奇怪的现象:我的数据明明没有缺失值,但跑完回归后,观测值却变少了!一开始我以为是 Stata “偷吃”了我的数据,差点就要给它“寄刀片”了。但冷静下来仔细排查后,才发现这背后隐藏了许多“玄机”。今天就和大家聊聊 为什么 Stata 会让观测值变少,以及如何避免这些“坑”。首先,Stata 并不会无缘无故“偷吃”你的观测值。它这么做,其实是有原因的,只不过这些原因可能藏得比较深。如果你也遇到过类似问题,可能是以下几个原因之一:如果你的回归模型中包含滞后变量(比如 ),那么每组的
2025-01-22 18:04:23
1092
原创 导师是怎么发现你造假的?显著性“手脚”无所遁形!
又到一年毕业季了,面对论文压力,总有人试图耍些“小聪明”,希望通过篡改数据或伪造结果来让自己的研究看起来“完美无缺”。在学术研究中,回归分析是最常用的统计方法之一,而“显著性”则是衡量结果是否具有统计意义的重要指标。显著性造假看似能让你的研究“更好看”,但实际上,它很容易被发现,后果也极其严重。如果你的研究涉及多个变量,但每个变量都显著,这种“完美”的结果往往不符合现实规律。科学的进步需要真实的数据,而不是“完美”的结果。如上所述,回归结果中的逻辑关系非常明确,任何篡改都可能被简单的计算或复现分析揭穿。
2025-01-07 18:47:50
382
原创 【小菲stata】最小二乘法(OLS)回归分析、模型检验及结果解读:Stata 的auto 数据集案例
需要特别强调的是,最小二乘法(OLS)是回归分析的基础,几乎所有复杂的回归模型(如广义线性模型、混合效应模型、面板数据模型等)都建立在OLS的原理之上。掌握OLS不仅能帮助你理解线性回归的核心思想,还能为后续学习更复杂的模型搭建坚实的理论框架。
2024-11-23 22:54:35
10556
原创 中介效应分析中的困惑:逐步回归与Bootstrap结果为何相悖?
Bootstrap分析提供了对效应变异性的更全面的视角,但结果的解释仍需结合理论背景和实际数据情况。在中介效应分析中,逐步回归法和Bootstrap方法是常用的技术。最近,我在知乎上看到一个有趣的问题:在中介效应分析中,使用逐步回归法得到的系数都是正的,但在进行Bootstrap检验时,中介效应的估计却为负。Bootstrap方法捕捉的是效应的分布特征,而不是单一的点估计。在某些样本中,可能会出现中介效应的方向与整体趋势不同的情况,这可能导致Bootstrap的估计值为负。
2024-10-18 13:39:03
1971
1
原创 毕业论文stata实证分析教学上篇:描述性分析和指标体系构建
在我的教学数据中,x4与其他x1-x3均是负相关,所以这个结果很正常,但是一般而言,我们选择的二级指标正相关较多,所以负权重较少见。这意味着当该变量的值增加时,因子或主成分的得分可能会减少。虽然因子分析和主成分分析是不同的统计方法,但在解释负权重时,它们的概念是相似的)主成分得分是数据点在主成分方向上的投影,可以为正或负,表示数据点在该方向上的相对位置,负得分可能表明数据点在该主成分方向上偏离中心的程度和方向。- 主成分是彼此正交的(即不相关的),并且每一个后续的主成分捕捉的是剩余数据中最大可能的方差。
2024-10-15 20:01:35
1156
原创 Stata教程:高级虚拟变量处理和标签添加
Hello,大家好,接粉丝提问,这期给大家分享虚拟变量处理和标签添加,在这个教程中,我们将使用Stata的"nlsw88"数据集 (这是一个关于1988年美国女性劳动力的数据集)来演示如何创建更复杂的虚拟变量,添加详细的标签,并进行基本的统计分析。label define wage_cat_lbl 0 "低于最低工资" 1 "低收入" 2 "中等收入" 3 "中高收入" 4 "高收入"label define edu_lbl 0 "高中以下" 1 "高中或大学肄业" 2 "大学及以上"
2024-10-10 17:58:21
2316
原创 0.05的魔力:统计显著性与小概率事件的有趣探索
用我们之前的比喻,这就像是在100面的骰子中连续两次都扔出了红色——这种情况发生的概率极低,因此我们有理由相信这不是偶然。下次当你在Stata中看到那个熟悉的结果表格,或者在研究论文中遇到"p
2024-09-30 15:00:39
1139
原创 门槛/门限效应模型
然后我们看门槛值分别是多少,但是前面这块,我们发现我们这里的可信区间不出现,我的这个数据没有严格的门槛效应,我也是随意设置的门槛变量,所以我们不能只看前面的p值,这里也是提醒数据不是很合适。Single和Double表示门槛个数的检验,Single表示的含义是:原假设认为不存在门槛值,备择假设是存在一个门槛值,Double表示的含义是:原假设认为存在一个门槛值,备择假设是存在两个门槛值。以科研为例,一般情况下,当我们花费在科研上的时间越多,成果就会越丰富,但是,这种正相关不一定是线性的。
2024-09-26 19:52:23
6481
原创 【互助问答】门槛效应该先跑单门槛还是三门槛?最大就是三门槛吗?
通常,从单门槛到双门槛,再到三门槛,模型的改进可能是显著的。首先,在研究门槛效应时,通常建议先从单门槛模型开始,然后再考虑更复杂的多门槛模型(如三门槛模型)。效率考虑:如果数据确实存在多个门槛,直接运行三门槛模型可能会节省总体时间,因为你不需要逐步增加门槛数量并重复运行模型。复杂系统的考虑:在某些复杂的经济或金融系统中,可能确实存在多个门槛,直接使用三门槛模型可以更好地捕捉这种复杂性。模型比较:通过先运行单门槛模型,你可以将其结果与多门槛模型进行比较,评估增加额外门槛是否显著改善了模型fit。
2024-09-18 13:22:56
1150
1
原创 毕业论文实证分析的一套基础流程代码:描述性 相关性 检验 回归 分析、稳健性分析
毕业论文实证分析的一套基础流程代码:描述性 相关性 检验 回归 分析、稳健性分析
2024-09-14 17:01:39
1648
原创 五分钟上手Stata熵权法:附详细代码与解释
最终得到的Ged指标综合反映了各个城市的绿色经济发展水平,可以用于城市间的横向比较和同一城市不同年份的纵向比较。"通过这个模型,我们得到了每个城市每年的绿色经济发展水平指标(Ged)。Ged值越高,表示该城市的绿色经济发展水平越高。"为了全面评估和比较不同城市的绿色经济发展水平,本研究采用了基于熵值法的综合评价模型。这种方法能够客观地确定各指标的权重,避免了主观因素的影响,同时充分利用了原始数据中的信息。通过这些步骤,我们能够将多个不同维度的指标整合为一个综合的绿色经济发展水平指标(Ged)。
2024-09-14 15:03:33
2615
原创 【小菲stata】回归模型通用的高效导出结果命令esttab,事半功倍!一学就会!
其中,被解释变量为汽车价格price,解释变量包括weight、mpg、foreign。hello,大家好,这期教学给大家分享一下回归模型的高效导出结果命令esttab。// ar2表示调整R²,p值可以更换成其他统计量,如标准误se、置信区间ci。p(%6.3f) ar2(3)设置估计系数保留三位小数,整数部分可以达到六位。首先,安装命令:Esttab是estout的简化版本,因此先安装外部命令。//b(%6.4f)设置估计系数保留四位小数,整数部分可以达到六位。导出模型m1、m2、m3结果。
2024-09-14 14:57:27
3506
原创 Stata入门教学-统计描述(集中趋势和离散趋势)
首先介绍最常见的统计描述,主要包括集中趋势和离散趋势集中趋势的统计描述,最常见的就是算数均数跟上次一样使用系统自带的汽车数据sysuse auto基本语法:summarize 变量名
2024-09-14 14:51:38
993
原创 【小菲stata】面板数据的简单回归分析和检验,附代码和讲解~
今天想给大家介绍一下面板数据最基本的回归,即固定效应模型和随机效应模型,以及做回归之前需要做的几个统计学检验。
2024-09-06 10:00:00
6689
1
原创 【小菲stata】如何将横截面数据合并且导入stata为面板数据
数据情况:样本:31个省份的面板数据年份:2009-2016年 八年数据因变量Y自变量:八个X。
2024-09-05 23:35:19
3237
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅