模式匹配与XML数据关键字查询结果枚举技术解析
1. 模式匹配实验评估
在合成模式匹配场景中,我们对所提出方法的时间成本和匹配结果质量进行了测试。实验数据基于两个人开发的在线书店生成。第一个书店模式包含31个属性,第二个包含35个属性,且每个模式有27个匹配属性。假设一个虚构用户持续访问书店,生成包含8000个查询的日志,这些SQL语句包括根据书店查询界面的随机查询和基于书店导航或分类功能生成的固定查询。基于查询日志,可得到两个书店的特征矩阵作为实验数据,使用FMeasure指标衡量算法性能。
- 一对一映射结果 :
- 如图3所示,使用“mon”和“non”分别代表单调函数和非单调函数,非单调函数的控制参数α设为0.3。随着匹配属性数量增加,匹配结果逐渐变差,“non”函数的最差结果接近60%,“mon”函数的结果更好。这是因为一对一映射中正确的km是已知的。
- n - 矩阵的结果整体质量高于p - 矩阵,原因是n - 矩阵收集的信息更多。
|映射类型|函数类型|结果趋势|最佳性能|
| ---- | ---- | ---- | ---- |
|一对一映射|mon|随匹配属性增加结果较好| - |
|一对一映射|non|随匹配属性增加结果变差,最差近60%| - |
graph LR
A[生成实验数据] --> B[进行一对一映射实验]
B --> C{函数类型}
C -->|mon| D[结果较好]
超级会员免费看
订阅专栏 解锁全文

851

被折叠的 条评论
为什么被折叠?



