基于图的混合推荐模型:原理、实现与评估
1. 研究背景与目标
在许多易变或受趋势驱动的领域中,个性化混合推荐模型的设计与实现至关重要。本研究着重运用先进的图数据库技术,该技术对于管理大型、复杂、非结构化、时变和动态数据具有潜在的实用性。其主要目标是开发一个基于图数据库的混合推荐系统,使其能在在线环境中作为网站的集成部分运行。
2. 系统流程图
推荐模型较为复杂,包含多个组件。为便于理解和解释,下面给出系统流程图。构建产品图主要涉及两个过程:数据准备和数据加载。
- 步骤 1:数据准备
- 非结构化数据处理 :若数据来源为非结构化,需先将从各种数据源收集的非结构化数据转换为半结构化数据格式,再存储到数据库中。这一过程会使用自然语言处理的各种数据提取技术,借助离线工具完成。数据提取完成后,要进行严格的数据清洗和转换,可手动操作或使用自动工具。最终,产品信息以描述该产品的关键词形式呈现,创建产品节点及相关产品细节(如唯一标识号、名称和价格),为每个新关键词创建新的值节点并与产品节点连接。
- 半结构化数据处理 :若数据为半结构化,以键值对或表格形式存在,可直接加载到图数据库中。为每个产品创建新的产品节点并存储相关属性,对于新值,若不存在于现有值节点中,则创建新的值节点并与产品节点连接;若已存在,则只需创建连接边。对于非结构化数据,还需基于专家知识进行值节点和属性节点的映射,创建它们之间的边,此步骤虽非推荐算法执行的必要步骤,但可提高图的可读性并帮助对产品进行树状分类。
- 步骤 2:知识图准备
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



