基于本体的数据摘要与RDF知识库的PageRank及实体摘要
1. 数据摘要与推荐系统概述
在数据处理和推荐系统领域,数据摘要和特征选择是重要的研究方向。不同的方法被提出用于模式和数据摘要,以描述数据集的整体内容。同时,推荐系统主要分为协同过滤和基于内容的系统,它们各有优缺点。
1.1 数据集的本体和数据维度
以下是三个不同领域数据集的本体和数据维度信息:
| 领域 | 最小模式数量 | 平均三元组数量 | 方差 |
| — | — | — | — |
| 电影 | 57757 | 74,015 | 549,313 |
| 书籍 | 41684 | 44,966 | 169,478 |
| 音乐 | 40481 | 80,502 | 981,509 |
1.2 相关工作
1.2.1 数据摘要方法
- SchemeEx :通过考虑类型和属性的共现,为大型数据集提取有趣的理论度量。
- Linked Open Vocabularies、RDFStats和LODStats :提供关于词汇表、类型和属性使用的统计信息。
- ABSTAT :使用模式模式表示类型之间的连接,并提供基数描述符。
- Loupe :提取与ABSTAT类似的模式模式,但没有最小化方法,且不提供属性或模式的基数描述符。
- TermPick
超级会员免费看
订阅专栏 解锁全文
1209

被折叠的 条评论
为什么被折叠?



