数据结构查询性能与网页模板块检测研究
在数据处理和网页分析领域,数据结构的查询性能以及网页模板块的检测都是重要的研究方向。下面将分别探讨几种数据结构在不同数据集上的查询时间,以及一种新的网页模板块检测方法。
1. 数据结构查询性能分析
在处理最近邻搜索(NNS)问题时,有多种数据结构可供选择,常见的有KD - Trees、Metric Trees和Cover Trees。为了评估它们的性能,对人工和真实世界的数据进行了广泛的实验。
1.1 不同数据集上的数据结构查询时间
以下是这些数据结构在UCI数据上的查询时间对比:
| 数据集 | KD - Trees | Linear Search | Metric Trees | Cover Trees |
| — | — | — | — | — |
| car(7) | 0.03 | 0.07 ◦ | 0.08 ◦ | 0.07 ◦ |
| mfeat(7) | 0.02 | 0.11 ◦ | 0.03 | 0.04 ◦ |
| cmc(10) | 0.02 | 0.05 ◦ | 0.07 ◦ | 0.04 ◦ |
| german - credit(21) | 0.06 | 0.06 | 0.09 ◦ | 0.09 ◦ |
| segment(20) | 0.03 | 0.13 ◦ | 0.08 ◦ | 0.08 ◦ |
| page - blocks(11) | 0.04 | 0.76 ◦ | 0.17 ◦ | 0.18 ◦ |
| sick(30) | 0.15 | 0.60 ◦ | 0.78 ◦ | 0.21 ◦ |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



