临床数据聚类分析方法解析
1. 引言
在临床研究中,具有单一诊断的患者群体往往存在显著的异质性,这种异质性会对预后和药物疗效产生影响。例如,抑郁症患者可能有反应性抑郁、失眠性抑郁或真性抑郁等亚型;胃癌患者的基因表达水平不同,其预后也有所差异;HIV 患者的不同特征会影响疫苗疗效等。在没有可用结果变量的数据样本中,聚类分析是识别亚组的合适替代方法。它基于患者特征相近则在预后和药物疗效等方面也可能相关的概念,且不需要因变量,是探索性数据挖掘和机器学习的重要方法。
2. 二维聚类分析方法
2.1 K - 均值聚类分析
K - 均值聚类分析与层次聚类的方向相反。它不是从每个患者自成一个聚类开始,而是随机选择聚类中心,然后通过迭代找到最适合数据的中心。该方法的一个重要假设是聚类大小相等,而层次聚类没有这个假设。
使用 SPSS 进行分析的操作步骤如下:
1. 选择“Analyze” -> “Classify” -> “K - means Cluster Analysis”。
2. 在“Variables”中输入“Age”和“Depression score”。
3. 在“Label Cases by”中输入作为字符串变量的患者编号。
4. 设置“Number of clusters”为 3(用于与上述方法进行比较)。
5. 点击“Method”,勾选“Iterate”。
6. 点击“Iterate”,设置“Maximal Iterations”为 10,“Convergence criterion”为 0。
7. 点击“Continue”。
8. 点击
超级会员免费看
订阅专栏 解锁全文
2577

被折叠的 条评论
为什么被折叠?



