基于层次聚类树的最优用户分类推荐方法
在当今信息爆炸的时代,推荐系统(RS)作为一种有效的信息过滤工具,正受到越来越多的关注。同时,聚类作为一种数据挖掘技术,也在推荐系统的预处理中发挥着重要作用。本文将介绍一种基于层次聚类树的最优用户分类推荐方法,旨在提高推荐系统的质量。
1. 推荐系统与聚类技术概述
推荐系统有多种方法,如协同过滤、基于内容的推荐、基于矩阵分解(MF)的方法以及基于序列模式的算法等。聚类技术则可分为划分式和层次式两种。层次聚类(特别是凝聚式层次聚类,AHC)相较于划分式聚类,其优势在于无需预先设定聚类的数量,这有助于提高推荐结果的稳定性。
2. 从聚类树中提取聚类
2.1 凝聚式层次聚类
数据挖掘的一项基本任务是将数据对象分组,使相似对象聚在一起,相异对象分开。AHC通过自下而上的方式递归地构建聚类,在许多应用中表现优于划分式聚类。
2.2 最优聚类选择框架(FOSC)
设数据集 $D = {d_1, d_2, \ldots, d_n}$,对其进行层次聚类的结果通常表示为一个具有 $(2 \times n - 1)$ 个节点的二叉聚类树,根节点包含所有数据对象。FOSC 是从层次聚类树的不同层次提取聚类的全局最优解决方案,其目标是通过从二叉聚类树中提取 $k$ 个聚类 ${C_{i1}, C_{i2}, \ldots, C_{ik}}$ 来形成数据集 $D$ 的一个划分 $P$。为确定最终划分 $P$,需要优化目标函数 $J(P)$:
[
\begin{align }
\text{Maximize } J(P) &= \su
超级会员免费看
订阅专栏 解锁全文
6801

被折叠的 条评论
为什么被折叠?



