数据库检索与数据挖掘技术在不同领域的应用研究
1. 数据库全文检索性能研究
在数据库全文检索性能研究方面,进行了一系列实验分析。
- 实验环境 :
- 硬件平台:HP 520 笔记本电脑。
- CPU:Core Duo T2600(2.16G)。
- 内存大小:2G。
- 数据库:MYSQL。
- 软件环境:Eclipse 3.4。
- 实验数据与分析 :
- 导入了 3 个共 1474 页、1474 条记录的 PDF 文档。
- 对随机选取的 6 个关键词,采用三种方法进行检索,并记录了耗时情况,具体如下表所示:
| 关键词 | 耗时(ms) | | |
| — | — | — | — |
| | Lucene | DB like | DB full - text |
| Computers | 156 | 406 | 79 |
| Action | 78 | 391 | 47 |
| Manning | 63 | 406 | 31 |
| Development | 78 | 453 | 47 |
| Software | 93 | 469 | 47 |
| Economy | 79 | 453 | 47 |
| 平均时间 | 87.9 | 429.7 | 51 |
从表中可以看出,基于 Lucene 的全文检索性能接近 MYSQL 数据库全文检索,且比 like 子句检索快很多,其耗时约为 like 子句检索的 1/5。不过,基于
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



