自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 Stata又双叒叕‘偷吃’数据了?背后真相竟是这样!

最近在跑回归模型的时候,发现一个奇怪的现象:我的数据明明没有缺失值,但跑完回归后,观测值却变少了!一开始我以为是 Stata “偷吃”了我的数据,差点就要给它“寄刀片”了。但冷静下来仔细排查后,才发现这背后隐藏了许多“玄机”。今天就和大家聊聊 为什么 Stata 会让观测值变少,以及如何避免这些“坑”。首先,Stata 并不会无缘无故“偷吃”你的观测值。它这么做,其实是有原因的,只不过这些原因可能藏得比较深。如果你也遇到过类似问题,可能是以下几个原因之一:如果你的回归模型中包含滞后变量(比如 ),那么每组的

2025-01-22 18:04:23 698

原创 【小菲stata】最小二乘法(OLS)回归分析、模型检验及结果解读:Stata 的auto 数据集案例

需要特别强调的是,最小二乘法(OLS)是回归分析的基础,几乎所有复杂的回归模型(如广义线性模型、混合效应模型、面板数据模型等)都建立在OLS的原理之上。掌握OLS不仅能帮助你理解线性回归的核心思想,还能为后续学习更复杂的模型搭建坚实的理论框架。

2024-11-23 22:54:35 7673

原创 中介效应分析中的困惑:逐步回归与Bootstrap结果为何相悖?

Bootstrap分析提供了对效应变异性的更全面的视角,但结果的解释仍需结合理论背景和实际数据情况。在中介效应分析中,逐步回归法和Bootstrap方法是常用的技术。最近,我在知乎上看到一个有趣的问题:在中介效应分析中,使用逐步回归法得到的系数都是正的,但在进行Bootstrap检验时,中介效应的估计却为负。Bootstrap方法捕捉的是效应的分布特征,而不是单一的点估计。在某些样本中,可能会出现中介效应的方向与整体趋势不同的情况,这可能导致Bootstrap的估计值为负。

2024-10-18 13:39:03 1078 1

原创 毕业论文stata实证分析教学上篇:描述性分析和指标体系构建

在我的教学数据中,x4与其他x1-x3均是负相关,所以这个结果很正常,但是一般而言,我们选择的二级指标正相关较多,所以负权重较少见。这意味着当该变量的值增加时,因子或主成分的得分可能会减少。虽然因子分析和主成分分析是不同的统计方法,但在解释负权重时,它们的概念是相似的)主成分得分是数据点在主成分方向上的投影,可以为正或负,表示数据点在该方向上的相对位置,负得分可能表明数据点在该主成分方向上偏离中心的程度和方向。- 主成分是彼此正交的(即不相关的),并且每一个后续的主成分捕捉的是剩余数据中最大可能的方差。

2024-10-15 20:01:35 773

原创 Stata教程:高级虚拟变量处理和标签添加

Hello,大家好,接粉丝提问,这期给大家分享虚拟变量处理和标签添加,在这个教程中,我们将使用Stata的"nlsw88"数据集 (这是一个关于1988年美国女性劳动力的数据集)来演示如何创建更复杂的虚拟变量,添加详细的标签,并进行基本的统计分析。label define wage_cat_lbl 0 "低于最低工资" 1 "低收入" 2 "中等收入" 3 "中高收入" 4 "高收入"label define edu_lbl 0 "高中以下" 1 "高中或大学肄业" 2 "大学及以上"

2024-10-10 17:58:21 1799

原创 0.05的魔力:统计显著性与小概率事件的有趣探索

用我们之前的比喻,这就像是在100面的骰子中连续两次都扔出了红色——这种情况发生的概率极低,因此我们有理由相信这不是偶然。下次当你在Stata中看到那个熟悉的结果表格,或者在研究论文中遇到"p

2024-09-30 15:00:39 909

原创 门槛/门限效应模型

然后我们看门槛值分别是多少,但是前面这块,我们发现我们这里的可信区间不出现,我的这个数据没有严格的门槛效应,我也是随意设置的门槛变量,所以我们不能只看前面的p值,这里也是提醒数据不是很合适。Single和Double表示门槛个数的检验,Single表示的含义是:原假设认为不存在门槛值,备择假设是存在一个门槛值,Double表示的含义是:原假设认为存在一个门槛值,备择假设是存在两个门槛值。以科研为例,一般情况下,当我们花费在科研上的时间越多,成果就会越丰富,但是,这种正相关不一定是线性的。

2024-09-26 19:52:23 3798

原创 论文stata实证分析全干货实战课程来啦

论文stata实证分析全干货实战课程来啦

2024-09-26 18:20:21 407

原创 【互助问答】门槛效应该先跑单门槛还是三门槛?最大就是三门槛吗?

通常,从单门槛到双门槛,再到三门槛,模型的改进可能是显著的。首先,在研究门槛效应时,通常建议先从单门槛模型开始,然后再考虑更复杂的多门槛模型(如三门槛模型)。效率考虑:如果数据确实存在多个门槛,直接运行三门槛模型可能会节省总体时间,因为你不需要逐步增加门槛数量并重复运行模型。复杂系统的考虑:在某些复杂的经济或金融系统中,可能确实存在多个门槛,直接使用三门槛模型可以更好地捕捉这种复杂性。模型比较:通过先运行单门槛模型,你可以将其结果与多门槛模型进行比较,评估增加额外门槛是否显著改善了模型fit。

2024-09-18 13:22:56 767

原创 毕业论文实证分析的一套基础流程代码:描述性 相关性 检验 回归 分析、稳健性分析

毕业论文实证分析的一套基础流程代码:描述性 相关性 检验 回归 分析、稳健性分析

2024-09-14 17:01:39 1092

原创 五分钟上手Stata熵权法:附详细代码与解释

最终得到的Ged指标综合反映了各个城市的绿色经济发展水平,可以用于城市间的横向比较和同一城市不同年份的纵向比较。"通过这个模型,我们得到了每个城市每年的绿色经济发展水平指标(Ged)。Ged值越高,表示该城市的绿色经济发展水平越高。"为了全面评估和比较不同城市的绿色经济发展水平,本研究采用了基于熵值法的综合评价模型。这种方法能够客观地确定各指标的权重,避免了主观因素的影响,同时充分利用了原始数据中的信息。通过这些步骤,我们能够将多个不同维度的指标整合为一个综合的绿色经济发展水平指标(Ged)。

2024-09-14 15:03:33 2025

原创 【小菲stata】回归模型通用的高效导出结果命令esttab,事半功倍!一学就会!

其中,被解释变量为汽车价格price,解释变量包括weight、mpg、foreign。hello,大家好,这期教学给大家分享一下回归模型的高效导出结果命令esttab。// ar2表示调整R²,p值可以更换成其他统计量,如标准误se、置信区间ci。p(%6.3f) ar2(3)设置估计系数保留三位小数,整数部分可以达到六位。首先,安装命令:Esttab是estout的简化版本,因此先安装外部命令。//b(%6.4f)设置估计系数保留四位小数,整数部分可以达到六位。导出模型m1、m2、m3结果。

2024-09-14 14:57:27 2163

原创 Stata入门教学-统计描述(集中趋势和离散趋势)

首先介绍最常见的统计描述,主要包括集中趋势和离散趋势集中趋势的统计描述,最常见的就是算数均数跟上次一样使用系统自带的汽车数据sysuse auto基本语法:summarize 变量名

2024-09-14 14:51:38 571

原创 【小菲stata】面板数据的简单回归分析和检验,附代码和讲解~

今天想给大家介绍一下面板数据最基本的回归,即固定效应模型和随机效应模型,以及做回归之前需要做的几个统计学检验。

2024-09-06 10:00:00 4393 1

原创 【小菲stata】如何将横截面数据合并且导入stata为面板数据

数据情况:样本:31个省份的面板数据年份:2009-2016年 八年数据因变量Y自变量:八个X。

2024-09-05 23:35:19 2194 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除