处理符号分数的偏好查询语言解析
1. 引言
在过去十年里,数据库查询中表达偏好的需求日益增长。一方面,更具表达力的查询语言能更准确地传达用户意图;另一方面,在查询中引入偏好可为检索项排序,这在满足查询的项集较大时尤为重要。
数据库偏好查询方法可分为定性和定量两类。定量方法通过单调评分函数(总分与部分分数正相关)来表达偏好,常采用属性值的加权线性组合。例如模糊集方法,使用隶属函数描述用户对查询中各属性域的偏好。定性方法则通过二元偏好关系定义偏好,典型代表是基于帕累托序的方法,旨在计算非支配答案。
本文介绍的方法属于定量模型类别,但旨在克服该类别中终端用户难以通过“深奥”评分函数定义偏好的缺点。我们采用符号量表表达偏好,并定义了基于 SQL 的查询语言 SQLSP(带符号偏好的 SQL),它不仅在选择条件中包含渐进特征,还在嵌套运算符和 having 子句中有所体现。
2. 偏好的表达
2.1 偏好量表
我们考虑由 κ 个级别组成的符号量表 S。例如,当 κ = 7 时,有 ω0 ≺… ≺ω6,对应的语言标签如下:
| 符号 | 语言标签 |
| ---- | ---- |
| ω0 | 拒绝 |
| ω1 | 非常弱 |
| ω2 | 弱 |
| ω3 | 中等 |
| ω4 | 好 |
| ω5 | 非常好 |
| ω6 | 理想 |
我们认为这样的量表足以评估答案的满意度,因为过高的精度(如模糊集方法中 [0, 1] 之间的实数)可能无用或难以解释。对于给定偏好 P 和符号量表 S,答案 x 的满意度记
超级会员免费看
订阅专栏 解锁全文
1216

被折叠的 条评论
为什么被折叠?



