数字图书馆推荐系统的扩展与优化:基于MapReduce的解决方案
1. 背景与问题提出
在当今数字化时代,图书馆收藏了大量的媒体资源,如书籍、电影、报纸等。传统上,图书馆通过分层编码的方式管理这些资源,帮助用户根据编码查询和找到书籍的物理位置。然而,这种方式要求用户具备良好的训练,才能提交正确的关键词进行跨学科或多维度的搜索。
为了提高用户满意度,图书馆开始提供推荐服务。其中,协同过滤(CF)是一种广泛使用的推荐技术,它基于相似用户可能有相似品味的假设。当用户提供反馈时,推荐服务会根据其他相似用户过去的偏好为该用户推荐物品。但协同过滤需要明确的用户信息来描述用户画像,而在图书馆系统中,用户通常不愿意在借书时对书籍进行评分,因此协同过滤推荐系统在数字图书馆中难以实施。
近年来,基于个人本体的推荐系统在多个领域得到应用。廖等人将协同过滤技术与个人本体模型相结合,为数字图书馆推荐英文资源,解决了为用户提供有效推荐的问题。他们提出可以从借阅记录中推断出隐式评分,因为从用户借阅记录中提取的关键词可以反映用户的偏好。这种方法被应用于个人本体推荐(PORE)系统中,虽然能有效提取潜在偏好,但每个推荐阶段的运行时间较长。
为了解决数字图书馆推荐系统的时间消耗问题,许多研究采用了并行计算,如MapReduce。MapReduce是一种由谷歌提出的并行计算模型,用于处理大量数据,具有高度可扩展性、高效性和可靠性。但以往的研究主要关注并行编程,没有将并行计算的特点与个人本体数据相结合。
2. 相关工作
MapReduce是一种用于处理和生成大型数据集的编程模型,它提供了一种抽象,让程序员定义映射(mapper)和归约(reducer)函数
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



