gitlab7runner
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
86、语言模型错误率分布估计与字符串中位数编辑方案
本文提出了一种语言模型错误率分布的估计方法,通过回归模型预测新语言模型的错误率分布,从而自动确定拒绝阈值;同时介绍了一种基于快速双字符串中位数计算的新数据集编辑方案,通过在数据集中添加误分类样本与其同类最近邻的中位数来降低分类错误。实验表明,该错误率估计方法在姓名和市镇数据上表现准确,而新编辑方案在约78%的试验中可提升分类性能。两种方法结合可用于OCR后处理等场景,具有良好的应用前景。原创 2025-10-21 10:27:59 · 17 阅读 · 0 评论 -
85、高效OCR后处理与未知语言模型拒绝阈值估计
本文提出一种基于加权有限状态转换器(WFST)的高效OCR后处理方法,并结合错误纠正解析技术提升识别准确率。通过构建语言模型、错误模型与假设模型的概率框架,优化参数以最大化识别率。针对未知语言模型,提出一种基于转换成本分布的拒绝阈值自动估计方法,能够在控制预期错误率的同时减少人工干预。实验结果表明,该方法在不同语言模型和样本条件下均能有效估计错误率并设置合理阈值,具有良好的实用性和扩展性。未来工作将聚焦于模型优化、适应性增强与实时处理能力提升。原创 2025-10-20 14:35:04 · 16 阅读 · 0 评论 -
84、人脸特征核融合与OCR后处理方法研究
本文研究了人脸特征核融合与OCR后处理方法。在人脸特征方面,提出基于核判别分析的融合框架,验证了其在FRGC 2.0数据库上优于线性判别分析和得分级融合的性能,尽管略逊于ICB2009方法,但具备更高的实用性与鲁棒性。在OCR后处理方面,构建了基于语言模型、假设模型和错误模型的加权有限状态转换器(WFST)框架,通过组合模型寻找最可能路径以纠正OCR输出错误,有效提升了文本识别准确性。两种方法分别为人脸识别与文字识别提供了高效、可靠的解决方案。原创 2025-10-19 14:35:08 · 15 阅读 · 0 评论 -
83、图像检索与面部识别的先进技术探索
本文探讨了图像检索与面部识别领域的先进技术。在图像检索方面,提出了一种改进的基于最近邻的内容基图像检索(CBIR)算法,通过优化对特征空间密度和样本集基数的鲁棒性,显著提升了检索精度。在面部识别方面,分析了传统方法在光照变化和图像模糊下的局限性,重点介绍了基于LBP、LPQ等直方图特征的多尺度模式直方图方法,并结合谱回归核判别分析(SR-KDA)提升识别性能。同时比较了得分级融合与核级融合两种信息融合策略,实验结果表明所提方法在FRGC 2.0数据集上取得了优越的验证准确率。最后总结了技术操作步骤,并展望了原创 2025-10-18 14:03:38 · 16 阅读 · 0 评论 -
82、图像检索技术:MDSS算法与平滑最近邻估计的应用与优化
本文探讨了多维度尺度显著性(MDSS)算法在纹理分类与检索中的应用,分析了其在高维数据下的计算效率问题,并比较了不同熵和散度度量方法的性能。针对基于内容的图像检索(CBIR)中存在的语义鸿沟问题,研究了相关性反馈机制中最近邻(NN)方法的应用及其局限性,包括样本集不平衡、小样本不稳定性和特征空间分布不均等问题。为提升检索性能,提出采用平滑最近邻估计结合局部搜索策略的改进方法,并通过实验验证了该方法在多个图像库上的有效性。结果表明,融合调节项与局部搜索的优化方案显著提高了平均精确率,为图像检索技术的发展提供了原创 2025-10-17 09:55:51 · 15 阅读 · 0 评论 -
81、图域中的大样本统计
本文研究图域中的大样本统计问题,通过将属性图表示为黎曼轨道流形中的点,建立了图分布的大数定律和中心极限定理,深入刻画了弗雷歇均值的性质并提出了其唯一性的充分条件,同时探讨了两个图的加权均值特性。研究成果为结构模式识别、图聚类、图量化等无监督学习方法提供了坚实的统计基础,并深化了对图数据几何结构的理解。原创 2025-10-16 09:55:14 · 13 阅读 · 0 评论 -
80、图论新解:Ihara系数与团数谱界的突破
本文探讨了Ihara系数在图与超图高阶关系结构分析中的优越性,提出了一种基于Motzkin-Straus定理的新团数谱上界——η-界。通过邻接矩阵平移不变性的理论创新,η-界显著优于传统谱界(B1和B2),在随机图实验中展现出更小的误差和更高的精度。结合二分搜索算法,η-界可高效计算,并有望应用于计算机视觉、模式识别等领域的最大团求解问题,为图匹配、聚类等任务提供更优的理论支持与实践工具。原创 2025-10-15 13:19:30 · 18 阅读 · 0 评论 -
79、Ihara系数:高阶学习的灵活工具
本文提出使用Ihara系数作为不规则无权超图的灵活表示方法,克服了传统超图拉普拉斯矩阵在表征高阶关系时的信息丢失和谱缩放问题。通过构建超图的二分图表示并高效计算其Ihara系数,避免了直接操作大规模有向线图的高计算成本。实验表明,基于Ihara系数的模式向量在类内超图表征、类分离性和聚类任务中均优于传统拉普拉斯谱方法,验证了其在高阶学习中的有效性与优势。原创 2025-10-14 15:39:31 · 19 阅读 · 0 评论 -
78、二分类器组合以最大化部分AUC及Ihara系数在高阶学习中的应用
本文探讨了二分类器组合以最大化部分AUC(pAUC)的方法及其在生物识别中的应用,提出了一种基于线性组合的pROC算法,并通过贪心策略扩展至多个分类器。实验表明该方法在低假阳性率下性能优越。同时,文章引入Ihara系数作为不规则无权重超图的新型表征方法,能够有效捕捉超边基数与关系阶数信息,在聚类任务中优于传统谱方法。未来可进一步优化组合策略并拓展Ihara系数的应用领域。原创 2025-10-13 15:54:49 · 17 阅读 · 0 评论 -
77、分类器组合:提升性能的新策略
本文探讨了两种提升分类器性能的组合策略:基于线性规划的排名边际最大化方法和最大化ROC曲线下部分面积(pAUC)的二分器组合方法。通过在10个UCI数据集上的实验,验证了排名边际最大化在多数情况下优于RankBoost和SVM,尤其在组合7个分类器时表现突出;而pAUC最大化方法则针对特定ROC区域优化,适用于关注特定误判成本的实际应用场景。两种方法为分类器集成提供了新的优化方向。原创 2025-10-12 16:48:28 · 13 阅读 · 0 评论 -
76、分类器训练与组合技术:原理、问题及解决方案
本文深入探讨了分类器训练与组合的关键技术,重点分析了BDC引导方法与PSL框架在级联分类器中的应用,揭示了BDC在最后阶段存在的过拟合问题,并提出通过引入额外正样本、增大基集规模等策略加以改进。同时,介绍了线性组合分类器通过最大化秩边际来优化AUC性能的方法。实验结果表明,改进后的BDC在泛化能力上优于传统方法,而线性组合策略在不确定成本参数的场景下表现出更强鲁棒性。未来研究方向包括优化增量学习机制与组合分类器效率提升。原创 2025-10-11 11:37:41 · 11 阅读 · 0 评论 -
75、统计对话特征的生成得分空间与级联增强集成训练的模块化方法
本文提出两种创新方法:基于生成得分空间的统计对话特征分类方法和级联增强集成训练的模块化方法。前者通过直接操作生成模型参数提升对话分类性能,后者结合PSL与BDC框架解决传统CoBE在训练效率与数据处理上的瓶颈,并探讨了其过拟合问题及优化策略,为对话系统与目标检测提供了高效、可扩展的新思路。原创 2025-10-10 14:53:26 · 15 阅读 · 0 评论 -
74、统计机器翻译与对话分类技术探索
本文探讨了统计机器翻译与对话分类技术的研究进展。在统计机器翻译方面,分析了贝叶斯自适应(BA)技术在小规模数据下的稳定性及其局限性,并对比了MERT方法在大数据量下的优势与波动风险;针对BA的改进方向提出了引入加权系数等未来策略。在对话分类领域,介绍了基于马尔可夫过程的观察影响模型(OIM)和稳态对话周期(SCP)模型,通过构建生成得分空间并结合判别分类器,提升了对人类对话行为模式的识别能力。文章还展示了相关技术流程的mermaid图示,系统梳理了关键模型与方法的应用逻辑。最后展望了两项技术在多语言交流、智原创 2025-10-09 13:12:26 · 12 阅读 · 0 评论 -
73、统计机器翻译的贝叶斯自适应方法
本文介绍了一种用于统计机器翻译的贝叶斯自适应方法,旨在解决在有限自适应数据和计算资源下模型性能不稳定的问题。该方法基于贝叶斯学习范式,将模型参数视为具有先验分布的随机变量,结合已有训练数据与少量领域特定的自适应数据,实现对对数线性模型权重的有效调整。相比传统的MERT方法,贝叶斯自适应技术表现出更高的稳定性、更小的置信区间以及更好的实时性能,尤其适用于特定领域翻译和实时翻译服务场景。实验结果表明,即使使用极少的自适应样本,该方法也能显著提升翻译质量并减少波动。文章还探讨了其数学原理、优势对比、未来发展方向及原创 2025-10-08 14:32:55 · 13 阅读 · 0 评论 -
72、句子聚类中的相似性词序列核方法
本文研究了基于核方法的句子聚类技术,重点探讨了词序列核(WSK)和双语词序列核(BWSK)在C-均值聚类中的应用。通过在BTEC和Europarl语料库上的实验,分析了不同核函数、n-元组阶数及双语信息对聚类效果的影响。结果表明,\bar{B}_2和\bar{B}_1^2核函数表现最优,且双语信息在大规模簇中能有效提升聚类质量。未来工作将聚焦于使用贝叶斯方法确定最优簇数,并扩展核函数以融合更多自然语言特征。原创 2025-10-07 15:06:01 · 14 阅读 · 0 评论 -
71、多语言文档语言检测与跟踪及句子聚类方法研究
本文研究了多语言文档的语言检测与跟踪以及句子聚类方法。在语言检测方面,提出结合随机学习弱估计(SLWE)与混合阶n-元语法模型的方法,具有高准确率和良好扩展性;在句子聚类方面,引入基于相似性词序列核的C-均值聚类方法,并扩展至双语场景,有效提升聚类质量。实验结果验证了方法的有效性,未来将探索多语言融合、模型优化及实际应用方向。原创 2025-10-06 09:32:00 · 10 阅读 · 0 评论 -
70、球面嵌入、分类与多语言文档语言检测的研究
本文探讨了球面嵌入与分类以及多语言文档中的语言检测与跟踪两个重要研究方向。在球面嵌入方面,通过指数映射将数据点嵌入球面流形,并利用内在均值和最近均值分类器(NMC)进行分类,实验表明该方法在多数数据集上具有良好的嵌入准确性和分类性能,但对局部结构复杂的Chickenpieces等数据集效果有限。在多语言文档处理方面,提出采用随机学习弱估计器(SLWE)结合混合阶n-元语法的方法,有效应对非平稳环境下短文本的语言切换问题,克服传统滑动窗口方法的局限性。研究表明,SLWE在动态语言识别中表现优越,尤其适用于口碑原创 2025-10-05 14:09:35 · 13 阅读 · 0 评论 -
69、球面嵌入与分类:解决非欧几里得相似度度量问题
本文探讨了在模式识别中处理非欧几里得相似度度量问题的方法,提出将对象嵌入到具有球面几何的超球面上以更好地表示不确定的差异。传统欧几里得嵌入难以准确表达非确定性距离,而伪欧几里得空间又缺乏度量性质。为此,文章引入基于测地距离的球面嵌入方法,利用黎曼流形上的指数映射与切空间优化策略,通过梯度下降和最优步长选择实现高效嵌入。该方法不仅保留了度量空间的良好性质,还支持构建几何分类器,为图像、手势、图结构等复杂数据的分类提供了新思路。原创 2025-10-04 15:37:27 · 16 阅读 · 0 评论 -
68、正则化Ricci流嵌入:解决非欧几里得数据问题
本文介绍了一种基于正则化Ricci流嵌入的方法,用于处理模式分析中的非欧几里得相似度数据。通过将数据表示为加权图并嵌入到流形上,利用Ricci流演化几何结构以消除曲率,逐步将非欧几里得距离转换为欧几里得距离。针对传统Ricci流嵌入中可能出现的数值不稳定问题,引入基于对偶图的热核正则化方法,有效平滑局部曲率波动,提升算法稳定性与分类性能。实验结果表明,结合核嵌入或Isomap嵌入,并应用正则化策略,能显著降低负特征分数,改善1-NN分类准确率。文章还提供了详细的算法流程、对比分析及实际应用建议,展示了该方法原创 2025-10-03 16:50:14 · 21 阅读 · 0 评论 -
67、差异表示法:用于三维数据分类的有效工具
本文介绍了一种基于差异表示法(DR)的三维数据分类方法,应用于哥伦比亚内瓦多·德尔·鲁伊斯火山的地震信号分类。通过短时傅里叶变换(STFT)和连续小波变换(CWT)生成信号的时频表示,并构建三维数组(信号×时间×频率)。针对不同表示方式提出适用的二维差异度量:对于信息不完整的频谱图数据,采用能弥补形状与连通性缺失的2DShape度量;对于CWT生成的尺度图数据,则使用简单的AMD度量即可获得优良分类效果。实验结果表明,基于时频表示的差异空间显著优于传统频谱方法,平均分类误差降低至13%-20%。研究强调了选原创 2025-10-02 10:50:40 · 12 阅读 · 0 评论 -
66、基于核与基于相异度的特征空间的实证比较
本文对基于核的分类(KBCs)和基于相异度的分类(DBCs)进行了实证比较,探讨了二者在不同数据集和分类器下的性能表现。实验表明,在参数选择适当时,KBCs与DBCs分类准确率相近;但参数不佳时,DBCs更具鲁棒性,尤其支持向量机对核参数敏感。此外,研究还展示了相异度表示在三维火山地震数据分类中的应用优势,二维相异度度量相比一维特征表示能更充分地利用数据信息,提升分类精度。未来工作将拓展至相对相异度表示与嵌入算法优化。原创 2025-10-01 12:16:18 · 12 阅读 · 0 评论 -
65、高效虹膜与眼角提取方法及核基与基于差异特征空间的实证比较
本文介绍了一种高效的虹膜与眼角自动提取方法,并在Bosphorus数据库上验证了其高成功率,尤其在引入眼部区域提取模块后虹膜检测达到100%准确率。同时,文章对基于核的分类(KBCs)和基于差异的分类(DBCs)进行了实证比较,结果显示DBCs在核参数未恰当选择时具有更高的分类准确率和更强的鲁棒性。研究为眼部特征提取和分类算法优化提供了有效方法与未来方向。原创 2025-09-30 12:55:24 · 12 阅读 · 0 评论 -
64、语音分割与眼部特征提取技术解析
本文深入解析了自动语音分割与高效虹膜及眼角提取两项关键技术。自动语音分割通过迭代估计条件概率并结合声学模型,利用DTW实现音素级对齐,无需人工标注即可获得高精度分割结果,适用于语音识别与TTS系统;眼部特征提取则基于人脸结构常识,采用YCbCr肤色去除、霍夫变换和多阶段边缘检测,以粗到细策略精准定位虹膜与眼角,应用于人脸识别与表情分析。文章还探讨了两类技术的优势、实际应用场景及未来在复杂环境适应性、多语言支持和实时性方面的挑战与发展路径。原创 2025-09-29 13:32:03 · 12 阅读 · 0 评论 -
63、基于声学聚类的自动语音分割与K - NN SVM性能提升
本文介绍了一种基于声学聚类与动态时间规整(AC-DTW)的自动语音分割系统,旨在实现高效准确的音素边界检测。系统分为粗分割、渐进细化和边界调整三个阶段,结合声学特征聚类与音素概率模型,无需依赖手动标注即可完成语音信号的精确分割。同时探讨了K-NN SVM中核参数与K值对决策边界的影响,提出未来可自动优化参数的学习方法。实验在Albayzin(西班牙语)和TIMIT(英语)数据库上进行,采用39维声学特征与不同子采样率评估性能。结果表明该方法在多语言环境下具有良好的分割效果和应用潜力,未来可结合深度学习进一步原创 2025-09-28 15:12:20 · 12 阅读 · 0 评论 -
62、利用K - NN SVM提升性能及与K - 最高拉格朗日乘子选择的比较
本文提出了一种基于K近邻的支持向量机(K-NN SVM)方法,通过仅使用局部区域内K个最近的支持向量进行分类,提升了传统SVM的性能。同时,与选择K个最高拉格朗日乘子的方法进行了比较,实验结果表明,在保持或提高分类准确率的同时,显著减少了所需支持向量的数量,降低了计算开销。研究基于图像分割数据集验证了方法的有效性,并探讨了高斯核下支持向量的冗余性及稀疏性优化问题。最后,文章总结了方法优势并展望了未来在自动K值选择、多分类扩展及算法融合方向的应用潜力。原创 2025-09-27 10:42:42 · 11 阅读 · 0 评论 -
61、向量流场中奇异模式的尺度和旋转不变检测
本文提出了一种在向量流场中实现旋转和尺度不变的奇异模式检测与描述框架。通过复解析基函数对局部流场进行线性逼近,并利用投影系数构建具有刚性变换不变性的流描述符。引入多尺度检测机制,结合奇异能量函数定义更广义的奇异模式,不仅涵盖传统消失点,还包括受背景流影响的非典型结构。实验在FLUID序列、卫星图像及JHU 3-D湍流数据集上验证了方法的有效性,能够准确检测涡旋、源、汇等模式并实现对称与非对称模式的聚类分析。该方法在流体动力学、计算机视觉等领域具有广泛应用前景。原创 2025-09-26 15:50:04 · 9 阅读 · 0 评论 -
60、基于特征级融合的人脸与掌纹生物识别技术
本文介绍了一种基于不变SIFT描述符和同构图表示的人脸与掌纹生物特征级融合方法。该方法通过提取SIFT特征、聚类分区、建立对应关系并构建同构图,实现人脸与掌纹特征的有效融合。采用求和与串联规则进行关键点融合,并利用K-NN和相关距离进行匹配验证。实验在IIT Kanpur和嵌合数据库上进行,结果表明该方法在识别率和误识率方面优于单一模态识别及其他融合技术。相比传统方法,其优势在于特征点数量不固定、充分利用全局特征以及同构图表示带来的高鲁棒性。文章还探讨了其在安防、门禁和移动设备等场景的应用前景,并展望了算法原创 2025-09-25 13:49:59 · 11 阅读 · 0 评论 -
59、基于指数衰减距离变换的形状描述符改进与生物特征融合技术
本文提出了一种基于指数衰减距离变换(EDDT)改进的圆盘调和矩描述符(DHMD),用于提升形状描述在图像检索中的性能。通过引入EDDT作为图像函数,增强了对形状边界的鲁棒性,同时保持低计算成本。此外,研究还设计了人脸与掌纹多生物特征的特征级融合方法,结合SIFT特征提取、K-中心点聚类与同构图构建,显著提高了识别准确性和系统鲁棒性。实验表明,改进后的DHMD在MPEG7数据集上优于传统形状描述符,而多模态融合技术在多数据库测试中表现优异。该技术可广泛应用于图像检索与安全认证领域,并具备进一步扩展至更多特征融原创 2025-09-24 11:50:08 · 18 阅读 · 0 评论 -
58、基于线性规划训练的最大后验核分类器
本文提出一种基于线性规划训练的最大后验核分类器,通过引入核化函数 $w(x, y)$ 替代直接估计后验概率 $P(y|x)$,实现与MAP分类器等效的分类性能。该方法将优化问题转化为线性规划,可高效求解,仅需调整核宽度参数 $\gamma$。在13个UCI二分类数据集上的实验表明,该方法具有良好的分类准确率和竞争力,尤其在Banana、Breast Cancer、Titanic和Twonorm等数据集上表现优异。尽管计算时间较专用SVM工具稍长,但其简洁的代价函数和无需正则化参数的优势为后续扩展提供了广阔空原创 2025-09-23 10:40:43 · 10 阅读 · 0 评论 -
57、大规模文本到图像检索及最大后验核分类器的研究
本文研究了大规模文本到图像检索中的贝叶斯K邻域模型及基于最大后验(MAP)的核分类器。在文本到图像检索方面,提出结合视觉词哈希(VWH)和局部敏感哈希(LSH)的FKNIR方法,提升计算效率与可扩展性,并在Corel和ImageCLEF数据集上验证了其在精度与训练速度上的优势。同时,提出一种基于MAP估计并通过线性规划求解的核分类器,避免正则化参数调优,具有成本函数灵活、易于扩展等优点,适用于医学图像分类、自然语言处理等领域。未来方向包括模型融合、哈希优化与跨领域应用。原创 2025-09-22 13:06:50 · 11 阅读 · 0 评论 -
56、动态线性组合与大规模文本到图像检索技术解析
本文探讨了动态线性组合分类器与大规模文本到图像检索技术。在分类器融合方面,提出了基于SDI的多种动态分数组合方法,包括DLC、Δ投票和Δ均值,并在BA-Fusion数据集上验证了其优于传统方法的性能。在文本到图像检索方面,介绍了基于局部词相关性估计的K邻域图像检索(KNIR)方法,结合贝叶斯框架提升了检索性能与可扩展性。实验结果表明,这些方法在AUC、EER等指标上表现优异,尤其适用于大规模场景。未来研究方向包括自适应组合机制、多模态特征融合及在视频、音频检索中的拓展应用。原创 2025-09-21 11:48:01 · 14 阅读 · 0 评论 -
55、生成嵌入的信息理论核与两类分类器的动态线性组合
本文研究了生成嵌入与信息理论核的结合在二维形状分类中的应用,并提出基于得分可判定性指数(SDI)的动态线性组合技术,用于提升两类分类器的性能。通过HMM对形状轮廓建模获得生成嵌入,并结合SVM进行分类测试,结果显示该方法具有竞争力。提出的SDI能够量化分类置信度,进而用于动态调整分类器组合权重,相比传统静态组合方法,在高精度需求场景下显著降低了错误率。实验验证了该技术在多模态生物特征识别中的有效性,并探讨了其在金融、医疗、网络安全等领域的拓展应用及未来优化方向。原创 2025-09-20 16:21:22 · 10 阅读 · 0 评论 -
54、音乐分类与二维形状识别中的特征组合与核方法
本文探讨了机器学习中音乐分类与二维形状识别的特征组合与核方法应用。在音乐分类方面,研究发现和弦是最有效的单特征,堆叠泛化为最优多特征组合方案。在二维形状识别中,提出将基于HMM的生成嵌入(如Fisher分数、状态空间嵌入等)与信息理论核(如Jensen-Shannon核、Jensen-Tsallis核及其加权版本)结合的方法,并通过Chicken Pieces数据库实验验证其有效性。结果表明,该方法在多种嵌入方式下优于传统核函数,尤其在标准化后显著提升性能。文章还分析了不同核函数特性及空间标准化的影响,并与原创 2025-09-19 13:33:59 · 11 阅读 · 0 评论 -
53、音乐分类特征组合研究
本文研究了音乐分类中的特征组合方法,涵盖了低级和中级音频特征的提取与应用。通过在GTZAN数据集上的实验,比较了多种特征组合策略,包括决策级融合(如多数投票、求和规则、堆叠泛化)和特征级组合(如特征拼接、核平均、多核学习)。结果表明,有监督的组合方法如堆叠泛化和多核学习能显著提升分类准确率。同时,利用递归特征消除分析了各特征的重要性,为优化特征选择提供了依据。文章还提出了实际应用建议和未来研究方向,旨在推动音乐分类技术的发展与应用。原创 2025-09-18 13:54:32 · 12 阅读 · 0 评论 -
52、嘈杂环境下多模型语音识别器性能提升与音乐特征组合研究
本文研究了嘈杂环境下多模型语音识别器的性能提升方法,提出通过选择多个最相似参考HMM进行插值及使用多SNR水平训练来增强鲁棒性,并结合AFE前端显著降低单词错误率。同时探讨了音乐分类中的多种特征组合方法,包括特征级的多核学习与决策级融合策略,验证了组合特征对分类性能的提升效果。研究还比较了不同方法在实际数据集上的表现,为语音与音乐信号处理提供了有效改进路径和应用前景。原创 2025-09-17 11:05:02 · 12 阅读 · 0 评论 -
51、基于内容的瓷砖检索系统
本文提出了一种基于颜色和纹理的瓷砖图像检索系统,通过分离颜色与纹理特征实现更精准的视觉相似性匹配。颜色信息采用累积直方图表示,纹理则利用对光照和噪声鲁棒的因果自回归(CAR)模型及局部二值模式(LBP)进行建模。CAR特征通过多尺度高斯金字塔和多方向分析提取颜色不变量,而LBP捕捉局部微结构模式。系统在包含3301张瓷砖图像的数据集上进行了心理视觉实验,结果显示CAR与LBP方法性能相当,约76%的检索结果被评估为相似或相当相似。最终系统融合两种纹理特征以提升检索多样性与准确性,并可扩展至纺织品、壁纸等结构原创 2025-09-16 11:19:30 · 13 阅读 · 0 评论 -
50、纹理退化描述符与瓷砖检索系统研究
本研究探讨了多种纹理退化描述符在检测细微纹理差异方面的性能,通过心理物理实验获取人类感知数据,并与视觉差异预测器(VDP)、结构相似性(SSIM)、马尔可夫特征、Gabor特征和局部二值模式(LBP)等自动描述符进行对比。结果表明,基于因果自回归模型的2D平移不变特征(尤其是CAR 2D结合L0.2范数)与人类感知具有最高相关性,显著优于SSIM和VDP。此外,研究还开发了一种基于多光谱马尔可夫随机场和LBP特征的瓷砖检索系统,能够有效应对光照变化,在大型商业瓷砖数据库中实现高精度、鲁棒的视觉相似性匹配,适原创 2025-09-15 09:04:51 · 10 阅读 · 0 评论 -
49、计算机视觉中的多特征相似性轮廓分组与纹理退化描述符评估
本文研究了计算机视觉中的两个关键问题:多特征相似性在轮廓分组中的应用与纹理退化描述符的心理物理评估。在轮廓分组方面,采用基于信息聚类的算法并引入多特征相似性度量,实验表明3-特征相似性显著提升了分组的鲁棒性与性能;在纹理处理方面,通过心理物理实验评估多种纹理描述符,发现基于二维因果自回归模型的描述符与人类视觉感知具有最高相关性,具备良好的稳定性和应用潜力。研究为图像理解、纹理压缩及视觉感知优化提供了理论支持和技术路径。原创 2025-09-14 15:36:32 · 10 阅读 · 0 评论 -
48、探索聚类集成技术性能极限与多特征相似性轮廓分组
本文探讨了聚类集成技术的性能极限,提出利用下界Γ评估聚类结果质量,并通过线性规划计算偏差Δ以衡量改进潜力。实验采用多种距离函数和聚类方法,在多个数据集上验证了Γ的有效性。同时,研究扩展至加权聚类集成与拟度量距离函数场景。此外,针对计算机视觉中的轮廓分组任务,提出采用多特征相似性提升分组鲁棒性。结果表明,Γ在多种设置下均具有紧致性和通用性,为聚类集成提供了可靠的理论评估工具。原创 2025-09-13 12:53:17 · 12 阅读 · 0 评论 -
47、基于证据积累的成对概率聚类与集群集成技术性能极限探索
本文探讨了基于证据积累的成对概率聚类(PPC)方法与集群集成技术的性能极限。PPC通过最小化经验与真实共关联矩阵间的差异,结合Baum-Eagon不等式实现高效优化,支持软分配与硬分区,在多个数据集上表现优异。集群集成技术则聚焦于寻找共识聚类,并通过下界评估近似解的性能极限。文章还分析了两种技术的联系与差异,展示了其在图像分类与客户细分中的应用,并展望了未来在算法优化、多领域拓展及与其他AI技术融合的方向。原创 2025-09-12 13:18:49 · 11 阅读 · 0 评论
分享