
统计基础
arlionn
毕业于西安交通大学,现任教于中山大学岭南学院。公众号「连享会 (ID:lianxh_cn)」创办人。
展开
-
总体与样本:定义、差异与示例
总体:通常指研究者感兴趣的问题所涉及的整个群体,既可以是有限的也可以是无限的。样本:指由研究者从总体中抽出的一部分个体所组成的集合,样本集合中个体的数量往往小于总体中个体的总数。Population 这个词汇具有一种引导研究者将总体概念与人类联想在一起的思维倾向,但是在实际研究中,总体可以是我们所感兴趣任何群体:对象、事件、组织、国家、物种、生物等等。总体概念的关键并不在于它指代的到底是什么,而在于不论它指代的具体是什么,它必定包含这个被指代对象的全集。转载 2022-12-31 12:26:28 · 646 阅读 · 0 评论 -
Stata:最大似然估计(MLE)简易教程
本文主要是介绍最大似然估计 (MLE) 的一些基础知识,并演示如何在 Stata 软件中进行最大似然估计。转载 2022-12-31 12:19:38 · 1759 阅读 · 0 评论 -
做学术需要搞清楚计量经济学里全部的数学原理吗?
做学术是否需要搞清楚高级计量经济学里的原理呢?转载 2022-12-11 19:22:22 · 485 阅读 · 0 评论 -
Stata:固定效应的颗粒度选择:实践与陷阱
在实证研究中,时间和个体双重固定效应模型随处可见。但在对个体固定效应选择时,究竟是选择更细的公司固定效应还是更粗的行业固定效应?为什么有时两种控制方法会使结果产生显著性变化,甚至符号变化?本文进一步总结了实践中固定效应模型的使用,并结合具体问题探讨了 “个体” 固定效应选择层级的问题。转载 2022-12-09 12:05:04 · 672 阅读 · 0 评论 -
Stata:因子变量系数引用技巧-coeflegend
因子变量 (Factor Variable) 是对现有变量的延伸,是从类别变量中生成虚拟变量、设定类别变量之间的交乘项、类别变量与连续型变量之间的交乘项或连续变量之间的交乘项 (或多项式)。在用 Stata 进行回归分析时,经常会进行剔除样本值、增减控制变量等操作,这使得因子变量的系数并不固定。因此,当我们想用估计系数值进行其它计算时,就需要不断修改对应值。此时,通过使用引用因子变量系数的方法,就会节省大量工作量。转载 2022-12-07 17:26:55 · 569 阅读 · 0 评论 -
聚类异质性:使用summclust进行统计推断
MacKinnon 等 (2022) 为聚类推断的有效性提供了检验方法。他们认为通过一系列特征统计量的分布特征可以分析聚类的有效性,并提供了 Stata 命令summclust。接下来,本文将介绍 MacKinnon 等 (2022) 提出的聚类有效性分析思路以及 Stata 实操过程,以便加深读者对于相关内容的理解,提高实证研究的可靠性。转载 2022-12-07 17:18:41 · 327 阅读 · 0 评论 -
Stata:正确理解置信区间
无论是描述性统计还是检验统计量,都是基于总体的样本进行估计的,因此存在不确定性。置信区间是指以同样的方式重新对总体抽样时,期望的估计出现在一定范围内的概率。转载 2022-12-07 17:09:50 · 1788 阅读 · 0 评论 -
Stata:被忽视的严格外生性假设
面板数据可以通过控制固定效应来控制不随时间变化的,且与解释变量相关的不可观测因素。在实证研究中,我们通常会认为控制固定效应后,外生性假设得以满足,参数估计是一致的。然而,控制固定效应满足的是同期外生性假设,严格外生性假设往往不成立。例如,当因变量对未来的自变量有影响,或者自变量和因变量部分受到共同因素的影响时,严格外生性会被打破,此时参数估计不一致。转载 2022-10-02 21:12:59 · 866 阅读 · 0 评论 -
Stata:最大似然估计入门教程(MLE)-ml
最大似然估计转载 2022-09-18 15:18:08 · 1603 阅读 · 0 评论 -
Stata:多元回归中控制其他因素不变的含义
这种保持其他因素不变或者控制其他因素在相同水平的方法只适用于实验数据,在观测数据中却很难做到。在实验中,可以轻易控制某一变量在不同个体之间保持相同水平,而获取观测数据时,由于不能对获得的样本值进行限制,我们很少能奢侈地保持某些变量不变。那么,在非实验条件下如何剔除控制变量的干扰呢?控制变量究竟是如何被 “控制” 的呢?转载 2022-09-14 09:45:32 · 752 阅读 · 0 评论 -
固定效应还是随机效应?
全文阅读:固定效应还是随机效应?| 连享会主页目录1. 引言 2. 主要问题 3. 固定效应和随机效应 4. 如何选择 4.1 高方差问题 4.2 偏差问题 4.3 实际考虑 5. 相关推文 在社会科学中,实证分析经常面对的是聚类或分组的定量数据。为了解释群体水平的变化并改善模型的拟合优度,学者们通常会选择一个固定或随机效应模型。但是,目前关于在什么条件下应该选择哪种方法的建议仍然含糊不清,有时甚至是相互矛盾的。全文阅读:固定效应还是随机效应..转载 2022-05-21 00:04:05 · 701 阅读 · 0 评论 -
Stata:多元正态t截断分布的命令
全文阅读:Stata:多元正态t截断分布的命令| 连享会主页目录1. 问题背景 2. 原理 2.1 多元正态分布 2.2 多元 t 分布 2.3 截断 MVN 和 MVT 分布 3. 命令介绍 4. 典例分析 4.1 密度比较 4.2 多元正态分布的拟合优度检验 5. 参考文献 6. 相关推文1. 问题背景由于绝大多数被收集的数据都被假定为正态分布,多元正态分布在统计学中扮演着重要角色。中心极限定理告诉我们对于满足均值为,方差为,且独立同分布的随机变量..转载 2022-03-24 21:57:04 · 484 阅读 · 0 评论 -
如何系统地自学计量经济学?
全文阅读:https://www.lianxh.cn/news/935d9de717d04.html目录1. 学习建议篇 2. 计量经济学入门资料推荐篇 3. 计量经济学进阶资料推荐篇 4. 计量经济学教材整理篇 5. 相关推文全文阅读:https://www.lianxh.cn/news/935d9de717d04.html...转载 2021-10-16 18:20:19 · 804 阅读 · 0 评论 -
p值、置信区间和统计功效:常见的25种误区
原文链接:https://www.lianxh.cn/news/48279b1cf67e2.html[Source]:Greenland S, Senn S J, Rothman K J, et al. Statistical tests, P values, confidence intervals, and power: a guide to misinterpretations[J]. European journal of epidemiology, 2016, 31(4): 337-35.转载 2021-07-24 16:03:56 · 830 阅读 · 0 评论 -
Stata:多个变量组间均值\中位数差异检验
作者:韩少真(西北大学) || 刘婉青(西北大学)Stata 连享会: 知乎 | 简书 | 码云 | 优快云 2019暑期Stata现场班,7.17-26日,北京,连玉君+刘瑞明 主讲 Stata连享会 精品专题 || 精彩推文文章目录1. 问题背景1.1 期刊论文示例一1.2 期刊论文示例二1.3 期刊论文示例三2. Stata实现组间均值或中位数差异检验的常见...原创 2019-05-30 10:34:28 · 80075 阅读 · 7 评论 -
数据可视化:带孩子们边玩边学吧
来源:Teaching Data Visualization to Kids译者:高娜娜 (中南财经政法大学) Stata连享会 精品专题 || 精彩推文想想我们在小学学到的所有东西,比如如何阅读、如何写作、如何数数、如何进行加减乘除。这些都是我们通过学习获得的技能,而不是天生就知道该怎么做。就像阅读、写作、数数以及做加减乘除一样,阅读图表( reading graph...原创 2019-04-26 17:50:08 · 633 阅读 · 0 评论 -
Stata: 快速呈现常用分布临界值表
侯新烁 | 连玉君 (知乎 | 简书 | 码云)Stata连享会 精彩推文1 || 精彩推文2编者按: 这是 UCLA 数字研究与教育研究所介绍的一个教学工具资源,该命令的作用是对几个常用分布的临界值表进行窗口显示。这篇推文帮助我们在教学和学习工作中更快速和便捷的获取临界值表,提高授课和学习效率。原文地址:UCLA - Stata Teaching Tools: Probab...原创 2018-10-29 09:08:48 · 11129 阅读 · 0 评论