R数据分析：潜在剖面分析LPA的做法与解释

最新推荐文章于 2024-05-13 14:13:04 发布

原创

最新推荐文章于 2024-05-13 14:13:04 发布 · 1.6w 阅读

114 ·

CC 4.0 BY-SA版权

本文详细介绍如何使用R语言进行潜剖面分析(LPA)，包括数据预处理、确定剖面数量的方法(BIC、ICL、BLRT)及模型拟合与可视化。通过对学生兴趣数据的实际案例操作，展示如何解释并命名不同剖面。

Latent Profile Analysis (LPA) tries to identify clusters of individuals (i.e., latent profiles) based on responses to a series of continuous variables (i.e., indicators). LPA assumes that there are unobserved latent profiles that generate patterns of responses on indicator items.

潜在剖面分析要做的事情就是根据个体在连续变量上的响应情况将个体分为互斥的群，或者说互斥的剖面。

大家肯定还听过潜在类别分析，其实潜在剖面分析和潜在类别分析在统计上都是一样的，唯一的不同就是显变变量是分类变量（二分类）的时候我们叫它潜在类别，显变量是连续变量的时候我们叫潜在剖面。

The difference between LPA and LCA is conceptual, not computational: LPA uses continuous indicators and LCA uses binary indicators

大家记住下面这张图：

R数据分析：潜在剖面分析LPA的做法与解释

老规矩，今天还是带着大家做一个潜在剖面分析的实例。

实例操练

今天手上有997个学生样本的数据集interests_clean.csv，对于每个学生我们都调查了他的兴趣爱好，总共有32个兴趣爱好，我们会让学生对每一个兴趣的爱好程度以1-5分进行打分，就得到了一个如下图的数据集：

R数据分析：潜在剖面分析LPA的做法与解释

今天要做的就是对此数据集进行潜剖面分析，我们希望通过学生对每个兴趣的响应将学生分为不同的剖面。

在进行潜剖面分析的时候需要我们的数据是没有缺失值的，同时我们有必要将所有的值进行标准化处理，以便观察不同剖面的差异从而给每个剖面命名。

interests_clustering <- interests_clean %>%
  na.omit() %>%
  mutate_all(list(scale))

上面的代码就将原始数据集进行了缺失删除处理和标准化。

接下来我们首先探索一下对于我们的数据我们应该分为几个剖面，这个问题一般情况下我们可以使用mclust包的mclustBIC看不同剖面模型的BIC，通常我们可以将不同模型的BIC画出来：

library(mclust)
BIC <- mclustBIC(interests_clustering)
plot(BIC)
summary(BIC)

R数据分析：潜在剖面分析LPA的做法与解释

最低0.47元/天解锁文章

8 条评论

godjing1985 2021.12.25
代码都不能被执行，也不知道你怎么抄的来灌水。

weixin_57400534 2021.11.19
楼主写的非常详细，很棒~我遇到一个问题，如何查看每个剖面的后验类别概率呀？老板让我加上Posterior Probability。不知道该如何做，求赐教，拜托[face]emoji:062.png[/face]

ErikJ 2021.05.26
遇到的另一个问题是，每次运行查看BIC、ICL的结果不一致，得到的可视化图形也不一致。是需要多次迭代，得到稳定的模型吗？

ErikJ 2021.05.26
有个问题想请教一下。在做完LPA，得到聚类结果后，能输出每个样本是属于哪个剖面的信息吗？因为想根据对样本的聚类结果，比较各剖面样本的其他信息
- psy_liuliu回复ErikJ 2021.09.14
  请问你找到方法输出每个样本是属于哪个剖面的信息的语句了吗？

小白在路上R 2021.03.07
抄袭不觉得可耻吗，这文章是你写的吗？ “自己的文章都写的很细” 是清华的还是北大的啊？不知道实事求是吗原作者链接：https://www.r-bloggers.com/2019/04/quick-example-of-latent-profile-analysis-in-r/ 文章中数据直接从这获取：library(tidyverse) survey <- read_csv("https://raw.githubusercontent.com/whipson/tidytuesday/master/young_people.csv") %>%select(History:Pets)[code=html] [/code][code=plain] [/code]
- m0_57771557回复小白在路上R 2022.07.22
  求问有潜在类别分析的原代码吗？谢谢
- m0_37837066回复小白在路上R 2022.05.22
  太感谢了，他这个看的我糊里糊涂的