节点和链接对象上的谓词解析
在处理Web数据时,我们常常需要对节点和链接对象施加各种约束条件,以筛选出符合特定要求的数据。比较自由谓词(comparison-free predicate)就是这样一种工具,它可以帮助我们对Web文档或超链接的元数据、内容或结构进行约束。
1. 比较自由谓词概述
比较自由谓词定义在节点或链接类型标识符上,用于对该类型标识符实例的元数据、内容或结构施加条件。一个比较自由谓词由以下几个组件构成:谓词限定符(predicate qualifier)、属性路径表达式(attribute path expression)、谓词运算符(predicate operator)和值(value)。其一般形式为:
[p(x) \equiv \text{predicate qualifier}::x{[\text{attribute path exp}]} \text{ predicate operator “V”}]
其中, x 是谓词的参数,根据约束应用于Web文档还是超链接,分别称为节点或链接类型标识符。谓词限定符决定了谓词的作用范围,它可以取 “METADATA”、“CONTENT” 或 “STRUCTURE” 这三个值,分别表示对元数据、文本内容或结构施加约束。
下面是一些比较自由谓词的示例:
- (p(x) \equiv \text{CONTENT}::x[\text{company}] \text{ ATTR CONT “(id, c12356)”}):该谓词对包含 company 元素的文档的属性/值列表施加约束,要求 company </
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



