数据库查询答案的模糊表征方法及天际线查询拓展
数据库查询答案表征方法
在数据库查询中,为了更好地理解和解释查询结果,我们可以采用一种基于模糊集的方法对查询答案进行表征,主要分为描述和表征两个步骤。
示例说明
以二手汽车查询为例,假设查询目标是二手汽车的年份和里程数,即 (A_{\pi} = {year, mileage}),而其他属性如价格、油耗、品牌等 (A_{\omega} = {price, consumption, make, …})。聚类后得到的结果如下:
| 聚类 | 描述 | 表征 |
| — | — | — |
| 聚类 1 | (年份为近期 (0.8) 或中期 (0.2)) 且 (里程数小 (1)) | (油耗为中等 (1)) 且 (价格为昂贵 (0.7) 或中等 (0.3)) |
| 聚类 2 | (年份为旧 (0.6) 或非常旧 (0.4)) 且 (里程数高 (1)) | (油耗为高 (0.8) 或中等 (0.2)) 且 (价格为低 (0.7) 或非常低 (0.3)) |
描述步骤
聚类形成后,需要将其投影到词汇表上,以便用自然语言描述聚类。对于属性 (A_j \in A_{\pi}) 的分区,聚类 (C_i) 的投影用模糊标签集 (F_{i,j} = {\mu_{L_j^k}(C_i)/L_j^k | L_j^k \in P_j}) 表示,其中:
(\mu_{L_j^k}(C_i) = \frac{\sum_{x \in C_i} \mu_{L_j^k}(x)}{|C_i|})
这里,(\mu_{L_j^k}(x)) 是 (x) 属于 (L_j^k)
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



