数据漂移分类问题与网页信息检索聚类技术的研究
在数据处理和信息检索领域,数据漂移和网页信息聚类是两个重要的研究方向。数据漂移会影响分类器的性能,而网页信息聚类则有助于提高搜索结果的质量。接下来将详细探讨这两个方面的相关内容。
数据漂移分类问题的处理方法
在模式分类中,数据漂移是一个常见的问题,它会导致分类器性能下降。为了解决这个问题,有两种主要的方法:
- 基于移动数据窗口的分类器再训练 :根据窗口大小,每次再训练迭代后构建一个新的模型。不过,与增量学习相比,这种方法比较耗时。
- 增量学习算法 :这些算法能够自然地逐步调整分类模型,无需存储训练数据。
下面是不同数据集和算法下的平均分类误差(%)表格:
| 数据 | 算法 | LDC | QDC | KNNC | PARZENC | BPXNC | SVC | RBNC |
| — | — | — | — | — | — | — | — | — |
| 人工数据 | 静态 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| | 慢速漂移 | 15.00 | 15.00 | 14.81 | 14.92 | 9.72 | 14.86 | 21.30 |
| | 中速漂移 | 37.61 | 37.65 | 37.42 | 60.07 | 35.57 | 37.46 | 59.74 |
| | 快速漂移 | 40.42 | 40.43 | 40.37 | 57.54 | 38.88 | 40.36 | 56.98 |
| 高斯数据 | 静态 | 14.40 |
超级会员免费看
订阅专栏 解锁全文
289

被折叠的 条评论
为什么被折叠?



