基于遗传算法的推荐系统聚类优化方案
1 引言
在推荐系统中,聚类算法是一种常用的技术,它可以将用户或物品划分为不同的组,从而提高推荐的准确性和效率。K-means算法是最常用的聚类算法之一,因其简单性和快速收敛性而备受青睐。然而,该算法存在初始种子选择的难题,聚类结果依赖于初始选择的种子,这是其最大的缺点。
为了解决这个问题,许多研究提出了不同的初始种子选择方法,主要分为基于统计和基于进化算法的两类。本文提出了一种基于划分的遗传算法,用于增强基于用户的协同过滤,以解决推荐系统中的可扩展性问题。
2 相关工作
2.1 协同过滤与聚类
协同过滤是一种广泛使用的推荐算法,它通过测量用户之间的相似度来选择邻居用户进行推荐。但这个过程耗时且计算复杂度高,因此出现了分布式协同过滤和用户聚类等方法来解决这些问题。
2.2 K-means算法的初始种子选择问题
K-means算法虽然简单快速,但初始种子的选择对聚类结果影响很大。不同的研究提出了各种初始种子选择方法:
- Zahra等人 :提出了多种K-means算法变体,利用相似度、密度、方差和平均值等选择最佳初始种子,并对用户进行过滤以改进算法,但未解决稀疏性问题。
- Cao等人 :提出迭代渐进初始种子选择方法,随机选择第一个种子,其余种子的选择与已选种子无关,算法效率受第一个种子选择的影响。
- Li等人 :提出基于欧几里得距离和邻居选择的中心聚类初始化方法,但只能处理有限数量(等于2)的聚类。
超级会员免费看
订阅专栏 解锁全文
1834

被折叠的 条评论
为什么被折叠?



