Integrating Prior Knowledge in Mixed Initiative Social Network Clustering

本文提出了一种名为PK聚类的新方法,旨在帮助社会科学家在社会网络中进行更有意义的聚类分析。该方法结合了用户先验知识,通过多种聚类算法的集成,可视化结果并允许用户根据先验知识评估和迭代选择,解决了传统聚类算法理解困难和参数选择盲目性的问题。论文实现了原型系统,包含13种聚类算法的多种配置,并通过两个案例研究和初步反馈展示了其实用性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文传送门

我们提出了一种新的范式——称为PK聚类——来帮助社会科学家在社会网络中创建有意义的聚类。存在许多聚类算法,但大多数社会科学家发现它们难以理解,并且工具没有提供任何指导来选择算法,或者考虑到科学家的先验知识来评估结果。我们的工作引入了一个新的集群范例和一个可视化分析用户界面来解决这个问题。它基于以下过程:1)将科学家的先验知识捕获为一组不完整的聚类,2)运行多个聚类算法(类似于聚类集成方法),3)通过每个算法与先验知识的匹配程度来可视化所有排序和总结的算法的结果,5)评估用户选择的算法之间的一致性,6)允许用户查看细节并迭代更新获得的知识。我们用一个最初的功能原型来描述我们的范例,然后提供两个使用的例子和来自社会科学家的早期反馈。我们相信,我们的聚类范例提供了一种新颖的建设性方法来迭代地构建知识,同时避免被经常随机选择的黑盒聚类算法的结果过度影响。

传统聚类不令人满意,主要原因有:

  • 这迫使他们一个接一个地尝试大量的黑盒算法,调整对他们来说毫无意义的参数;
  • 即使一个参数对他们有意义,比如要计算的聚类数,k-means聚类中的k,他们也不知道什么值会产生好的结果,只能试错;
  • 即使他们可以根据他们的先验知识来费力地评估所有聚类算法的结果,但是没有一个现有的系统允许用户这样做,导致用户放弃并盲目地接受他们尝试的第一个算法的结果。

本文的贡献:

  • 一种新的交互式聚类范例
  • 原型。用13种不同族的聚类算法应用不同的参数配置实现PK聚类;
  • 两个案例研究

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值