R语言进行数值模拟：模拟泊松回归模型的数据

拓端研究室TRL

于 2019-06-12 14:18:21 发布

阅读量3.3k

点赞数

CC 4.0 BY-SA版权

分类专栏：统计分析 R语言大数据部落数据分析报告文章标签： R语言数值模拟模拟泊松回归模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/tecdat/article/details/91518119

数据分析报告同时被 3 个专栏收录

9 篇文章 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

11 篇文章

订阅专栏

11 篇文章

订阅专栏

本文介绍如何使用R语言进行数值模拟，特别是模拟泊松回归模型的数据。通过模拟展示了考虑到回归系数不确定性的必要性，以及不考虑这种不确定性可能对模拟结果的影响。通过比较模拟数据和原始数据的均值和方差，强调了正确模拟方法的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

模拟回归模型的数据

验证回归模型的首选方法是模拟来自它们的数据，并查看模拟数据是否捕获原始数据的相关特征。感兴趣的基本特征是平均值。我喜欢这种方法，因为它可以扩展到广义线性模型（logistic，Poisson，gamma，...）和其他回归模型，比如t -regression。这是Gelman和Hill在回归文本中的内容。1可悲的是，从R中回归模型模拟数据的默认方法错过什么人可能会考虑模型不确定性的一个重要来源-在估计回归系数的差异。

您的标准回归模型假设存在将预测变量与结果相关联的真实/固定参数。但是，当我们执行回归时，我们只估计这些参数。因此，回归软件返回表示系数不确定性的标准误差。在所有其他条件相同的情况下，较小的样本量导致我们更大的系数不确定性意味着更大模拟模型数据的默认方法忽略了这种不确定性。这是一个大问题吗？也许不是那么多。但如果不忽视这种模型不确定性的来源，那就太好了。

我将用一个例子来证明我的意思。

示范

我将使用泊松回归来证明这一点。我模拟了两个预测变量，一个连续，xc和一个二进制，xb。并使用50的小样本。

library(MASS) # For multivariate normal distribution, handy later on
n <- 50

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。