基于ESIC的RBF神经网络网页文本分类器与纺织瑕疵分类方法研究
1. 基于ESIC的RBF神经网络网页文本分类器
随着互联网的迅速发展,网络文本分类变得至关重要。这里介绍一种基于增强群智能聚类(ESIC)的径向基函数(RBF)神经网络分类器。
1.1 训练与测试流程
ESIC - 基于RBFNN分类器包括训练和测试过程,其流程如下:
graph LR
A[训练过程] --> B[使用ESIC算法获取候选隐藏神经元]
B --> C[基于梯度下降学习过程训练神经网络]
D[测试过程] --> E[使用训练好的网络进行分类]
在训练过程中,如果第j个余弦RBF的参考距离$j_a$趋近于零,则可以在训练过程中消除该余弦RBF。
1.2 实验设置
- 数据获取 :实验的训练数据和测试数据通过Google、Yahoo和DIKU获取。为获取正数据(属于国际会议征稿CFPs类别),收集文件模块向Google发送“call for paper”查询并访问DIKU页面;为获取负数据,向Google和Yahoo发送16个查询(如travel、program等),每个查询收集20页以避免偏差。
- 分类标准 :收集的正数据应包含会议名称、主题、程序委员会、提交截止日期和除日期外的提交信息。
- 对比方法 :将该分类器与传统的OLS RBF分类器、支持向量机(SVM)分类器和BP神经网络分类器进行比较。
- 数据规模 :训练集有1208个文件(正426个,负782个),测试集有506个文件(正158个,负348个)。
1.3 性能评估指标
使用以下三个主要指标评估算法性能:
- 准确率(Accuracy):$Accuracy = \frac{# of files classified correctly}{# of test data}$
- 精确率(Precision):$Precision = \frac{# of files classified correctly in Positive data}{# of files classified as Positive data}$
- 召回率(Recall):$Recall = \frac{# of files classified correctly in Positive data}{# of Positive data}$
1.4 实验结果
| β(ESIC的群相似度系数) | 初始RDFs数量 | 最终RDFs数量 | 准确率(%) | 精确率(%) | 召回率(%) |
|---|---|---|---|---|---|
| 0.85 | 92 | 61 | 92.01 | 86.21 | 90.90 |
| 0.80 | 91 | 61 | 93.33 | 86.61 | 92.10 |
| 0.75 | 87 | 58 | 94.25 | 87.71 | 92.93 |
| 0.70 | 85 | 55 | 94.79 | 88.84 | 93.11 |
| 0.65 | 81 | 54 | 95.77 | 89.79 | 94.27 |
| 0.60 | 74 | 53 | 96.21 | 91.20 | 94.89 |
| 0.55 | 69 | 52 | 96.91 | 92.19 | 95.52 |
| 0.50 | 64 | 52 | 97.36 | 92.77 | 96.31 |
| 0.45 | 60 | 52 | 97.15 | 93.15 | 96.85 |
| 0.40 | 55 | 51 | 97.77 | 94.00 | 97.02 |
| 0.35 | 52 | 50 | 98.13 | 95.69 | 97.76 |
| 0.30 | 50 | 47 | 98.43 | 96.83 | 97.85 |
| 0.25 | 47 | 46 | 98.87 | 97.09 | 97.97 |
| 0.20 | 46 | 45 | 99.03 | 97.78 | 98.12 |
实验结果表明,尽管群相似度系数的变化会影响原始RBFNN的数量,但该分类器仍保持良好性能,平均准确率高于96.42%,平均精确率高于92.13%,平均召回率高于95.40%。与其他分类器相比,SVM在大多数情况下准确率更高(高于96.89%),但ESIC - 基于RBFNN分类器的准确率明显高于传统RBF网络分类器和BP,平均精确率和召回率也高于BP、SVM和OLS RBF。
2. 基于小波重建和BP神经网络的纺织瑕疵分类
在纺织行业,瑕疵检测和分类对于产品质量评估至关重要。传统的人工检测存在准确性、一致性和效率方面的问题,因此研究自动检测和分类方法具有重要意义。
2.1 研究背景
目前,大多数缺陷检测算法应用了高斯马尔可夫随机模型、共生矩阵方法、傅里叶变换、Gabor滤波器和小波变换等。其中,小波变换在数字图像处理中具有重要应用,因其具有高方向敏感性和良好的空间 - 频率分辨率。人工神经网络(ANN)方法在模式识别中成为热点,可处理各种线性和非线性问题。
2.2 硬件配置与图像预处理
- 硬件配置 :使用分辨率为640×480像素 - 1280×960像素的CCD相机,通过USB 2.0接口连接到嵌入式板,该板驱动可调照明灯光和移动板。相机在USB2.0连接下以640×480像素分辨率每秒捕获25帧。
- 图像预处理 :使用VC++平台和DirectX SDK(版本9.a)进行编码,控制USB相机输入、数字图像处理、小波分析和神经网络算法。首先将RGB颜色转换为256级灰度,然后应用互滤波过程减少噪声干扰,接着进行基于直方图的平衡处理以获得更好的对比度。实验表明,若图像未进行直方图均衡化处理,可能无法通过小波变换提取缺陷。
2.3 小波变换的方向特性
小波变换是一种多分辨率变换,可设计为金字塔或树结构,类似于子带分解。通过金字塔算法进行小波分解,使用一对小波滤波器(低通滤波器和高通滤波器)计算小波系数。原始图像经过低通和高通分解滤波器生成四个较低分辨率的分量:一个低 - 低(LL)子图像(近似原始图像,也称为平滑图像)和三个详细子图像(分别代表原始图像的水平、垂直和对角线方向)。
graph LR
A[输入图像f(x,y)] --> B[LP]
A --> C[HP]
B --> D[LP - LP]
B --> E[LP - HP]
C --> F[HP - LP]
C --> G[HP - HP]
D --> H[2↓]
E --> I[2↓]
F --> J[2↓]
G --> K[2↓]
这些子图像包含不同信息:通过行方向高通滤波器和列方向低通滤波器过滤的信息对应水平方向的详细信息和垂直方向的平滑信息,即经向纹理信息;反之,可获得纬向纹理信息;使用两个方向的高通滤波器可提取对角线方向信息。水平和对角线详细子图像可有效去除所有重复的垂直线图案,仅保留局部异常。在实际研究中,发现正交小波通常优于双正交小波,且小波基的较长支撑可能会过度平滑局部异常,计算效率较低。
根据织物材料的不同纹理,需要选择四个子图像之一或其组合进行小波合成,以消除恢复图像中的所有规则、重复纹理图案。该方法可处理两种类型的纹理:具有各向同性图案的统计纹理和具有定向图案的结构纹理。各向同性图案的图像重建从平滑子图像获得,而定向图案的图像重建从选择性详细子图像获得。
2.4 瑕疵分类步骤
对于常见的两种纺织瑕疵(油污和孔洞),分类步骤如下:
1.
瑕疵区域分割
:对平滑子图像进行膨胀处理,然后找到强度区域的四条边以确定瑕疵区域,得到一个矩形区域。
2.
特征提取
:计算“孔洞”和“油污”的直方图作为BP神经网络的输入。“孔洞”类型的瑕疵有更多白色,而“油污”类型有最深的黑色,可利用这一差异区分两种瑕疵。由于图像有256个灰度级,将其压缩到32级以确保识别准确性并避免繁重的计算负担。
3.
模式识别
:使用BP神经网络进行训练和识别,确定瑕疵类型。
通过一些样本测试,结果表明该方法能有效检测缺陷并以较高的识别正确率对缺陷类型进行分类。
基于ESIC的RBF神经网络网页文本分类器与纺织瑕疵分类方法研究(下半部分)
3. 两种分类方法的总结与对比
前面分别介绍了基于ESIC的RBF神经网络网页文本分类器和基于小波重建和BP神经网络的纺织瑕疵分类方法,下面对这两种方法进行总结与对比。
3.1 方法总结
| 分类方法 | 核心技术 | 应用场景 | 主要优势 |
|---|---|---|---|
| 基于ESIC的RBF神经网络网页文本分类器 | ESIC算法获取候选隐藏神经元,梯度下降学习训练网络 | 网页文本分类,如国际会议征稿分类 | 准确率、精确率和召回率较高,在网页文本分类中表现良好 |
| 基于小波重建和BP神经网络的纺织瑕疵分类 | 小波变换去除纹理,直方图特征提取,BP神经网络分类 | 纺织瑕疵分类,如油污和孔洞分类 | 能有效处理不同纹理织物,检测和分类瑕疵准确率高 |
3.2 对比分析
- 数据类型 :网页文本分类处理的是文本数据,而纺织瑕疵分类处理的是图像数据。
- 核心算法 :前者基于ESIC和RBF神经网络,后者基于小波变换和BP神经网络。
- 应用领域 :分别应用于互联网信息处理和纺织行业质量检测。
4. 未来展望与应用拓展
这两种分类方法在各自领域都展现出了良好的性能,未来可以在以下方面进行拓展和优化。
4.1 网页文本分类方法拓展
- 多领域应用 :将基于ESIC的RBF神经网络分类器应用于更多领域的文本分类,如新闻分类、电商商品评论分类等。
- 模型优化 :进一步研究ESIC算法和RBF神经网络的参数优化,提高分类性能。
graph LR
A[现有网页文本分类模型] --> B[多领域应用拓展]
A --> C[模型参数优化]
B --> D[新闻分类]
B --> E[电商商品评论分类]
C --> F[提高分类性能]
4.2 纺织瑕疵分类方法拓展
- 瑕疵类型扩展 :研究更多类型的纺织瑕疵分类,如褶皱、断线等。
- 实时检测系统开发 :结合工业自动化技术,开发实时的纺织瑕疵检测系统。
| 拓展方向 | 具体内容 |
|---|---|
| 瑕疵类型扩展 | 研究褶皱、断线等瑕疵的特征提取和分类方法 |
| 实时检测系统开发 | 利用工业相机和嵌入式系统,实现实时检测和分类 |
5. 结论
本文介绍的基于ESIC的RBF神经网络网页文本分类器和基于小波重建和BP神经网络的纺织瑕疵分类方法,在不同领域都具有重要的应用价值。基于ESIC的RBF神经网络分类器在网页文本分类中表现出良好的性能,平均准确率、精确率和召回率都较高;基于小波重建和BP神经网络的纺织瑕疵分类方法能有效检测和分类纺织瑕疵,具有较高的识别正确率。
未来,可以通过拓展应用领域、优化模型参数等方式,进一步提高这两种分类方法的性能和实用性,为互联网信息处理和纺织行业质量检测提供更有效的解决方案。
总之,这两种分类方法为相关领域的自动化处理和质量控制提供了可行的技术手段,有望在实际应用中发挥更大的作用。
超级会员免费看
3772

被折叠的 条评论
为什么被折叠?



