基于超图的图书馆在线资源推荐方法
1. 引言
在大数据时代,各组织投入大量资金挖掘数据集中的隐藏模式,以做出有利决策。网络分析利用工具挖掘从网络服务器获取的网络使用数据,网站常将用户浏览和交互信息存储在服务器日志中,用于分析用户浏览模式,进而提升网站可用性。
数字图书馆在用户与在线资源交互时会收集大量数据,因此会运用各种数据分析工具来分析这些使用数据。通过分析,图书馆可以确定浏览量最少的文档集,识别使用图书馆最多或最少的用户等。本研究分析了网络服务器的日志,由于订阅和版权问题,服务器日志通常只包含资源标题,所以推荐系统仅使用资源标题。研究使用了多种基于内容和用户访问模式的聚类算法来设计推荐系统,使用关联规则挖掘(ARM)生成用户访问模式,并使用基于超图的分区算法 hMETIS 从关联规则中生成聚类。结果表明,基于超图分区的推荐系统提供了最准确的推荐。
本研究的目标有两个:
1. 为图书馆的在线资源确定一种有效的基于聚类的推荐方法,通过比较不同的聚类算法来实现。
2. 确定一种能够推荐内容上不相似但因用户访问模式相关的物品的推荐方法。
2. 相关工作
近年来,图书馆分析被用于帮助图书馆员和用户。许多研究人员提出了不同的推荐方法,利用数据集的不同特征,如用户访问模式、URL 数据和网络使用数据,来提高在线服务的质量。
一些研究利用图书馆使用数据来发现本科生的图书馆使用模式,或者将图书馆资料的使用与学生的学业成绩相关联。还有研究使用关联规则聚类对数字图书馆的电子资源进行聚类,以及预测未来图书馆用户的需求。
不同的研究工作使用了不同的聚类算法来对内容相似的物品进行分组。例如,K - 均
超级会员免费看
订阅专栏 解锁全文
16

被折叠的 条评论
为什么被折叠?



