手写数字分类与分布式知识发现技术解析
在当今的数据处理领域,手写数字分类和分布式知识发现是两个重要的研究方向。下面将详细介绍相关技术及其应用。
手写数字分类:基于粒子群优化的仿射变换
在手写数字分类中,利用像素信息进行分类的方法主要分为生成式和判别式两种。生成式方法旨在寻找生成模型,而判别式方法则侧重于寻找分类模型,且分类模型通常通过监督学习方法进行学习。当前,由于分类技术的进步,判别式方法在研究中占据主导地位。不过,生成式方法的优点在于它只需要一小部分原型数字作为训练数据。
这里提出了一种利用粒子群优化技术(PSO)搜索任意手写数字合适仿射变换参数的方法。该方法属于生成式方法,因为它能找到生成扭曲数字原始姿态的变换参数。
具体来说,从Gbest粒子获取的信息会被解码回变换函数$p(t) = (x_{11}, …, x_{ij}) ⇒(θ, s_x, s_y, h_x, h_y, t_x, t_y)$。实验结果表明,基于互信息和墨水交叉的当前测量指标,能够在一定程度上引导搜索找到给定扭曲数字的合适仿射变换函数。同时,Gbest分数可以作为一个较好的分类分数,平均Gbest分数能够成功指示数字类别,但每次单独运行的准确性仍有提升空间。
分布式知识发现:DKDD_C方法
随着数据规模的不断增大,传统的集中式知识发现方法在执行时间和内存空间方面的性能逐渐下降,因此分布式知识发现(DKDD)应运而生。然而,现有的DKDD方法存在一些局限性。
- 理论方面 :DKDD算法会生成大量难以利用和吸收的关联规则,这不仅需要大量内存空间来进行数据建模,还会导致管理这些
超级会员免费看
订阅专栏 解锁全文
171万+

被折叠的 条评论
为什么被折叠?



