52、受限聚类:现状与新趋势

受限聚类:现状与新趋势

1. 引言

监督学习方法一直是人工智能解决方案的核心,长期以来证明了其可行性。“大数据”现象,即可用数据量的巨大增长,加上计算能力的提升,使得深度学习等神经元方法得以复兴。这些方法在图像分析和理解等领域取得了显著成果,迅速推广到决策辅助和决策制定等相关领域。

然而,这些方法存在一些缺点。一方面,学习过程的“黑箱”特性和模型性质(如具有学习权重的网络)使专家难以理解和解释,提取可复用或可转移的知识并应用于其他领域仍是一个挑战。另一方面,这些方法依赖于用户和/或领域专家提供的学习和验证数据,且这些数据需完全代表潜在概念和数据分布。创建这样的学习集非常耗时,尽管众包等方法可缓解这一问题,但创建学习集意味着问题可被形式化且感兴趣的对象可被定义,这在现实中往往不成立,导致算法容易出错。

这些问题促使了无监督方法的发展,无监督知识发现是数据挖掘的核心,尤其是聚类。实验表明,聚类方法能够从大量异构数据中提取有意义的簇,而无需额外的先验信息。但由于主题类别的缺乏形式化和缺乏真实参考数据,难以准确评估结果的质量,专家无法直接验证和修改簇。因此,需要重新思考和改进聚类过程,使结果更符合专家的主题“直觉”。

聚类过程本质上是无监督的,缺乏监督时,聚类算法常产生不相关的解决方案。近期研究聚焦于利用背景知识或专家知识指导聚类过程,以避免误判随机或无意义数据中的模式。为了减少专家干预,理想的解决方案是将专家知识转化为可操作的约束。目前提出了三种与应用领域无关的知识表示形式:
- 对象间的约束(比较约束),如必须链接(must - link)和不能链接(cannot - link)关系。
- 使用带标签的对象(标签约束),直接对应领域知识。
-

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值