科研论文推荐与齿轮箱故障诊断技术研究
科研论文推荐技术
1. 推荐流程与数据处理
在科研论文推荐系统中,用户的点击会作为偏好提交,这个过程会持续进行,直到为用户推荐相关实体。当向用户推荐实体时,与这些实体相关且经过排名的研究论文也会同时被推荐,前提是用户点击了确切的相关术语。
为了测试模型性能,采用了 RARD II 数据集,该数据集包含 1474 个 XML 格式的查询。具体实现环境为配备 4.9 GHz 时钟速度的 i7 - 1195G7 处理器和 16 GB RAM 的计算机,使用 Google Collaboratory IDE 下的 Python 3.9.10 进行编程。在预处理步骤中,运用了 Python 的自然语言工具包(NLTK)。领域本体使用 web protegee 进行构建,而本体模型的条目则通过定制爬虫进行抓取,最终使用 web protegee 将其形式化为本体,原因是它轻量级且易于处理。
2. 模型实验与性能评估
对 HyResPR 模型和基线模型在 RARD II 数据集上进行了实验,共涉及 1474 个查询。基线模型在与 HyResPR 相同的环境下对相同数量的查询进行了评估。用于评估 HyResPR 方法性能的指标包括准确率、召回率、精确率、F - 分数和错误发现率(FDR)。
从相关图表可以看出,在各种方法中,HyResPR 在准确率、召回率、精确率、F - 分数百分比方面均超过了所有现有模型,且 FDR 低至 0.05。具体性能数据如下表所示:
| 模型 | 精确率 | 召回率 | 准确率 | F - 分数 | FDR |
| ---- | ---- |
超级会员免费看
订阅专栏 解锁全文
1336

被折叠的 条评论
为什么被折叠?



