Web数据的节点、链接对象及建模技术解析
1. 位置子树相关概念
在处理Web数据时,位置子树是一个重要的概念。对于位置子树,有以下几个关键要点:
- 位置属性:例如在某个位置子树中,参考顶点的单词数量会影响定位顶点的位置属性。如参考顶点w30的单词数为57,定位顶点w10的位置属性就是(w30, 51);在另一个例子中,参考顶点w110的单词数为1,定位顶点w111的位置属性则是(w110, 1)。
- 定位顶点特性:
- 至少存在一个定位顶点有一个或多个子顶点。像图中的定位顶点w75、w10和w111分别在不同的位置子树中都至少有一个子顶点。
- 对于非叶子节点的定位顶点,必须至少有一个可到达的数据对象。例如在图中,定位顶点w75可到达数据对象w77,定位顶点w111可到达数据对象w117、w118、w119、w120和w121。
- 如果定位顶点的一个子顶点是数据对象,那么其余子顶点必须是无孩子的标签对象。
2. 超链接的表示
2.1 超链接的重要性及定义
在Web环境中,超链接对于关联非相邻的数据部分至关重要。作者倾向于创建多个小页面而非单一的大型文档,以降低检索延迟。超链接是两个或多个数据对象或数据对象部分之间的显式关系。在WHOM中,超链接由Link类型定义,它由链接元数据属性、链接结构属性和参考标识符三个组件组成。
2.2 建模超链接的问题
2.2.1 标签和标签属性建模
Web文档中的超链接由标签和标签属性指定,标签可能包含其他标签。例如,HTML文档中使用 标签和href或name属性指定超链接, 标签可能包含子元素如
超级会员免费看
订阅专栏 解锁全文
16

被折叠的 条评论
为什么被折叠?



