广义线性混合模型

本文详细介绍了广义线性模型(GLM)、广义线性混合模型(GLMM)的概念,强调了它们在处理复杂关系和随机误差方面的差异。GLM适用于线性和非线性关系,而GLMM则考虑了误差的分布特性。文中还列举了R语言和SAS等软件包在实现这两种模型时的特点和局限性,包括nlme、lme4、MCMCglmm等,并对比了它们在处理混合模型时的优缺点。

GLM一般是指 generalized linear model ,也就是广义线性模型;而非 general linear model,也就是一般线性模型;而GLMM (generalized linear mixed model)是广义线性混合模型。

广义线性模型GLM很简单,举个例子,药物的疗效和服用药物的剂量有关。这个相关性可能是多种多样的,可能是简单线性关系(发烧时吃一片药退烧0.1度,两片药退烧0.2度,以此类推;这种情况就是一般线性模型),也可能是比较复杂的其他关系,如指数关系(一片药退烧0.1度,两片药退烧0.4度),对数关系等等。这些复杂的关系一般都可以通过一系列数学变换变成线性关系,以此统称为广义线性模型。

广义线性混合模型GLMM比较复杂,GLM要求观测值误差是随机的,而GLMM则要求误差值并非随机,而是呈一定分布的。举个例子,我们认为疗效可能与服药时间相关,但是这个相关并不是简简单单的疗效随着服药时间的变化而改变。更可能的是疗效的随机波动的程度与服药时间有关。比如说,在早上10:00的时候,所有人基本上都处于半饱状态,此时吃药,相同剂量药物效果都差不多。但在中午的时候,有的人还没吃饭, 有的人吃过饭了,有的人喝了酒,结果酒精和药物起了反应,有的人喝了醋,醋又和药物起了另一种反应。显然,中午吃药会导致药物疗效的随机误差非常大。这种疗效的随机误差(而非疗效本身)随着时间的变化而变化,并呈一定分布的情况,必须用广义线性混合模型了。

广义线性混合模型GLMM(Generalized Linear Mixed Model),是广义线性模型GLM 和线性混淆模型LMM 的扩展形式,于二十世纪九十年代被提出。GLMM因其借鉴了混合模型的思想,其在处理纵向数据(重复测量资料)时,被认为具有独特的优势。GLMM不仅擅长处理重复测量资料,还可以用于任何层次结构的数据(因为本质上又是多水平模型)。

广义线性混合模型GLMM,可以看做是线性混合模型LMM的扩展形式,使得因变量不再要求满足正态分布;也可以看作是GLM的扩展形式,使得可以同时包含固定效应和随机效应。

使用GLMM的软件包

R语言中的nlme:lme()应用于线性混合模型,nlme()应用于非线性混合模型。可以定义复杂的方差结构,不支持广义线性混合模型(GLMM),对于镶嵌结构(nested)的随机因子定义简单,但对于交叉的随机因子(crossed)定义困难;

R语言中的lme4:nlme的进一步扩展,支持GLMM,很难处理交叉的随机因子,运行速度要快于nlme;

R语言中的MCMCglmm:用马尔可夫链蒙特卡罗(Markov Chain Monte Carlo,MCMC)的方法拟合模型,贝叶斯先验分布,可以定义一些复杂的方差结构(heterogeneous yes, AR1 no);

SAS中的PROC GLIMMIX模块支持了Laplace approximation和adaptive Gaussian quadrature方法,但对于复杂的模型,用的还是PQL方法;

SAS中的PROC MIXED模块执行一般线性混合模型(LMM);

ASReml

ASReml-R包:是ASReml软件的R版本,运算速度快,支持复杂的模型(随机因子的定义G矩阵和残差矩阵的定义R矩阵),支持系谱信息和多性状分析,在动物、作物、林木、水产育种和科研中应用广发。

GenStat软件的GLMM模型

Packages

For now, this page is only covering "basic" mixed modeling packages (although the line is admittedly somewhat blurry): see the list of packages on the main page for packages covering additive mixed models, Cox regression, etc.

In a nutshell

R packages

  • MCMCglmm. Uses MCMC instead of ML to fit the model. Bayesian priors can be included. Some complex variance structures (heterogeneous yes, AR1 no).
  • nlme One of the first widely-used mixed-models software for S-Plus. Ported from S-plus to R. Nested random effects easily modeled. Crossed random effects difficult. Stable (maintenance-mode). Multiple functions (lme for linear, nlme for nonlinear, gls for no random terms). Complex (and custom) variance structures possible. No GLMMs.
  • lme4. Under active development, especially for GLMMs. No complex variance structures. Uses sparse matrix algebra, handles crossed random effects well. Much faster than nlme.
  • glmmADMB interface to ADMB (see below); flexible, but slower than other R packages.

non-R

  • ADMB. Automatic Differentiation Model Builder. Mostly used in Forestry/Fish/Wildlife. Started out as a commercial product, but now open-source. Non-linear models handled. ADMB-RE, implements random effects in non-linear models via Laplace, importance sampling, GHQ in some cases.
  • SAS Commercial. Full-featured.
    • PROC MIXED implements modern LMMs; it is very widely used with lots of examples, but can be very slow.
    • PROC GLIMMIX added generalized models; it now incorporates Laplace approximation and adaptive Gaussian quadrature, but falls back to PQL for models with complex correlation structures. It also has other features such as simpler syntax to request predicta
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值