食谱推荐与基于标签的资源推荐研究
食谱推荐算法性能分析
在食谱推荐领域,有多种算法可供选择,主要包括基于内容的过滤(Content Based Filtering)、协同过滤(Collaborative Filtering)和机器学习(M5P)算法。以下是这些算法的平均绝对误差(MAE)对比:
| 算法 | MAE |
| — | — |
| 基于内容的过滤 | 1.2083 |
| 协同过滤 | 1.2614 |
| 机器学习(M5P) | 0.9774 |
从数据可以看出,CF和CB推荐器的准确性较为相似,CB比CF的准确性仅提高了0.05。而M5P算法表现最佳,其MAE为0.98。在覆盖率方面,M5P策略为每个用户实现了100%的覆盖率,CB策略达到92%,CF策略仅为83.8%。综合来看,机器学习方法整体表现最优。
用户输入推理分析
为了深入了解M5P算法性能提升的原因,我们进行了进一步研究。我们使用了三类元数据:复杂度数据(详细说明食谱中的步骤和食材数量)、菜系数据(根据菜系类型对食谱进行分类)和宽泛类别(根据食谱中包含的主要食物类型对食谱进行分类)。
我们采用了基于相关性的特征选择算法(CFS)来计算特征子集的“优点”。优点的计算公式为:
[MS = \frac{k r_{cS}}{k + k(k - 1)r_S}]
其中,$k$是所选集合$S$中的特征数量,$r_{cS}$是类别$c$和特征集合$S$的平均特征 - 类别相关性,$r_S$是集合$S$中特征间的平均相关性。相关性使用对称不确定性计算:
[u(X, Y) = 2 \left(\fr
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



