聚类分析在临床数据中的应用与比较
1. 聚类分析简介
聚类分析是探索性数据挖掘中的重要方法,也是机器学习的主要任务之一。它在经济学和社会学领域被广泛用于识别群体子组,但在临床研究和药物研究中应用较少。在临床研究中,具有单一诊断的患者群体往往存在很大的异质性,这可能影响预后和药物疗效。聚类分析基于患者特征的相似性将患者分组,不需要依赖结果变量,有时也被称为无监督机器学习。
2. 二维聚类分析
2.1 示例数据
以年龄和抑郁评分作为变量,展示了三种聚类方法的分析结果,数据通过图形呈现,包括层次聚类分析图、k - 均值聚类分析图和基于密度的聚类分析图。
2.2 k - 均值聚类分析
- 原理 :与层次聚类相反,k - 均值聚类不将每个患者作为一个单独的聚类开始,而是随机选择聚类中心,然后通过迭代找到最适合数据的中心。该方法假设聚类大小相等,这是与层次聚类的重要区别。
- 操作步骤 :使用SPSS进行分析,具体命令如下:
- 选择“Analyze” -> “Classify” -> “K - means Cluster Analysis”。
- 在“Variables”中输入“Age”和“Depression score”。
- 在“Label Cases by”中选择患者编号作为字符串变量。
- 设置“Number of clusters”为3。
- 点击“Method”,勾选
超级会员免费看
订阅专栏 解锁全文
20

被折叠的 条评论
为什么被折叠?



