motor
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
27、FEM与多层FEM:特征解释方法解析
本文详细解析了FEM(Feature Explanation Method)和多层FEM(Multi-Layered FEM)两种特征解释方法,重点在于其在卷积神经网络(CNN)中的应用。文章通过多种实验设计,包括不同阈值选择策略、与GradCam方法的比较以及对图像杂乱程度的敏感性测试,评估了这些方法在像素重要性图生成方面的性能。研究还探讨了统计自适应阈值和2σ规则对FEM和多层FEM性能的影响,并分析了分类结果对解释质量的依赖性。最终发现,多层FEM在多个指标上优于传统FEM和GradCam方法,但其性原创 2025-08-30 00:32:36 · 59 阅读 · 0 评论 -
26、特征解释方法:FEM与多层FEM的深入解析
本文深入解析了特征解释方法(FEM)和多层特征解释方法(MLFEM),包括特征重要性图的归一化处理、基于统计自适应阈值的重要特征选择、多层特征的融合策略等内容。通过在Salicon和Cat2000数据集上的实验,验证了方法的有效性,并分析了其优势与局限性。MLFEM通过融合多个卷积层的特征解释图,提高了特征归因的质量,为深度学习模型的决策过程提供了更深入的理解。原创 2025-08-29 11:18:29 · 76 阅读 · 0 评论 -
25、基于强化学习和顺序QAP的图匹配及特征解释方法
本博客介绍了两种图像分析与深度学习模型解释的关键技术:一是基于强化学习和顺序二次分配问题(QAP)的图匹配方法,用于提升图像语义分割的效果并降低计算复杂度;二是特征解释方法(FEM)及其多层扩展(MLFEM),旨在提高深度神经网络决策过程的可解释性。文章还探讨了种子大小对图匹配性能的影响、FEM与MLFEM的特征过滤策略,并提出了未来研究方向,如自动学习最优种子大小、探索更有效的解释方法等,为图分析与可解释AI的发展提供了理论支持与实践指导。原创 2025-08-28 09:43:22 · 65 阅读 · 0 评论 -
24、强化学习与基于顺序QAP的图匹配在图像分割中的应用
本文探讨了基于强化学习和顺序二次分配问题(QAP)的图匹配方法在图像分割中的应用,通过在FASSEG和IBSR数据集上的实验验证了其在语义分割中的效果。研究发现,该方法在小数据集上提升了分割质量,尤其是在Hausdorff距离指标上表现突出。通过使用顺序匹配和强化学习学习序列,分割性能得到优化,同时种子大小对计算时间的影响也为效率优化提供了方向。原创 2025-08-27 11:40:17 · 62 阅读 · 0 评论 -
23、基于强化学习和顺序QAP的图像语义分割图匹配方法
本文提出了一种基于强化学习和顺序二次分配问题(QAP)的图像语义分割图匹配方法。通过将分割结果建模为图,并利用强化学习优化匹配顺序,该方法在降低计算复杂度的同时提升了分割准确性。实验表明,该方法在少量训练样本下表现优异,并有效结合了图结构信息和深度神经网络的预测结果。原创 2025-08-26 14:44:18 · 71 阅读 · 0 评论 -
22、印度新冠疫苗推特情感分析
本博客聚焦于印度新冠疫情第二波期间获批使用的两款疫苗Covaxin和Covishield,在社交媒体平台推特上的情感分析。通过数据提取、预处理和情感分析模型评估,使用XLNet模型对疫苗推文进行情感分类,并结合词云分析和情感趋势分析,揭示公众对两款疫苗的关注点、情感倾向及其变化。博客还探讨了分析中使用的技术要点以及未来扩展方向,为相关部门制定政策和措施提供了参考依据。原创 2025-08-25 10:57:06 · 38 阅读 · 0 评论 -
21、印度新冠疫苗公众舆论的情感与词云分析
本文针对2021年1月至11月印度第二波新冠疫情前后,公众对Covaxin和Covishield疫苗在社交媒体平台推特上的讨论进行了情感分析与词云研究。通过使用迁移学习方法,微调预训练的XLNet Transformer模型,并在有情感注释的美国航空公司推文数据集上进行训练,以预测未标记疫苗相关推文的情感倾向。研究旨在评估公众对两种疫苗的接受度、情感随时间的变化及其影响因素,并利用词云技术进行主题分析,揭示公众关注的核心问题。结果显示,随着时间推移,公众对疫苗的接受度和信任度显著提高,同时词云分析进一步验证原创 2025-08-24 16:27:57 · 81 阅读 · 0 评论 -
20、基于补丁攻击的语义分割复杂性分析及印度新冠疫苗推文情感研究
本博客探讨了两个独立但重要的研究主题:一是基于补丁攻击在语义分割中的复杂性分析,揭示了其在生成任意输出图方面的局限性,并通过理论与实际线性区域数量的对比加以证明;二是对印度新冠疫苗(Covaxin和Covishield)在社交媒体上的影响研究,特别是在2021年印度第二波新冠疫情前后公众情感和讨论热点的分析。研究利用情感分析和词云技术,动态评估了公众对疫苗的态度,为公共卫生政策制定提供了有价值的见解。原创 2025-08-23 10:40:11 · 36 阅读 · 0 评论 -
19、基于补丁的语义分割攻击可行性与复杂性分析
本文探讨了基于补丁的语义分割攻击的可行性与复杂性。通过在简单数据集和Cityscapes数据集上的实验,验证了对抗补丁在语义分割任务中的攻击效果,并分析了其在现实场景中的鲁棒性和潜在安全风险。文章还讨论了此类攻击的局限性,并提出了未来研究的方向,包括更复杂场景的探索和安全防护机制的开发。原创 2025-08-22 16:02:05 · 31 阅读 · 0 评论 -
18、离线手写数学表达式识别的编码器 - 解码器方法
本文介绍了一种基于编码器-解码器框架的离线手写数学表达式识别方法。通过引入多尺度注意力、十字交叉注意力和坐标注意力模块,结合残差注意力机制和标签平滑技术,有效提升了模型的识别准确性和泛化能力。实验表明,该方法在CROHME数据集上取得了显著的性能提升。未来的研究方向包括解码器改进、数据增强和多尺度处理。原创 2025-08-21 13:17:13 · 98 阅读 · 0 评论 -
17、自蒸馏自监督单目深度估计与离线手写数学表达式识别
本文探讨了计算机视觉与模式识别领域的两个重要方向:自蒸馏自监督单目深度估计与离线手写数学表达式识别。在自蒸馏方法的基础上,分析了其在深度估计任务中的潜力与应用。同时,深入研究了离线手写数学表达式识别的技术挑战与最新进展,重点改进了基于WAP模型的编码器结构,引入了残差注意力模块、标签平滑等策略,显著提升了识别准确率。文章还展望了未来可能的研究方向,如更复杂的注意力机制、解码器架构优化以及多尺度信息集成等。原创 2025-08-20 12:18:55 · 54 阅读 · 0 评论 -
16、自蒸馏自监督单目深度估计方法解析
本文介绍了一种基于自蒸馏和自监督学习的单目深度估计方法,通过引入自蒸馏损失、伪标签过滤和多种一致性强制策略,有效提升了模型在深度估计任务中的性能和鲁棒性。文章详细解析了方法原理、实现步骤和实验结果,并探讨了其在自动驾驶、机器人导航等领域的应用前景。原创 2025-08-19 12:39:58 · 91 阅读 · 0 评论 -
15、店铺招牌检测与单目深度估计技术解析
本文深入解析了店铺招牌检测与单目深度估计的技术原理及实验结果。在店铺招牌检测部分,对比了YOLOv3和SSD模型在不同输入分辨率和颜色方案下的性能表现,YOLOv3在高分辨率RGB图像下展现出更优的平均精度。同时,分析了颜色方案、分辨率对检测效果的影响以及训练过程中的关键点。在单目深度估计方面,探讨了自监督学习方法,结合自蒸馏与一致性正则化策略,有效提升了深度估计的准确性和可靠性。文章还总结了两种技术的操作要点,对比了各自的优势与挑战,并展望了未来发展方向。原创 2025-08-18 12:19:12 · 50 阅读 · 0 评论 -
14、利用 ShoS 数据集进行店铺招牌检测
本文介绍了利用ShoS数据集进行店铺招牌检测的研究工作。ShoS数据集包含来自加拿大和美国51个城市的10,000个店铺招牌,通过Google Street View图像构建而成。研究使用YOLOv3和SSD目标检测模型进行实验,并分析了不同输入分辨率和颜色方案对检测性能的影响。结果表明,YOLOv3在RGB颜色方案和640×640分辨率下取得了最优性能,mAP@0.5达到94.23%。此外,研究还探讨了模糊样本对模型鲁棒性的提升,以及该技术在市政管理、导航与旅游、商业分析等领域的应用前景。原创 2025-08-17 11:49:11 · 86 阅读 · 0 评论 -
13、电子垃圾设备的高效分割:数据集优化与模型评估
本文探讨了电子垃圾设备部件的高效实例分割方法,重点介绍了数据集优化策略与多个先进模型的性能评估。通过对印刷电路板、读写头及手机部件的数据集扩展与精简,提升了模型的检测精度。在模型评估中,YOLOv8 表现出最佳的精度与速度平衡,平均精度达到 70.5%,推理速度高达 89 FPS。研究还分析了不同模型在阴影误检、角度影响等方面的性能差异,并提出了未来在数据集扩展、模型创新和多任务学习方面的研究方向。原创 2025-08-16 09:27:01 · 43 阅读 · 0 评论 -
12、电子垃圾设备的高效分割:深度学习解决方案
随着电子垃圾数量的快速增长,自动化回收技术变得至关重要。本文探讨了使用深度学习实例分割模型来实现电子垃圾设备的高效分割,从而支持机器人进行自动化拆解和回收。研究评估了多种先进的实例分割方法,包括YOLOv8、UNINEXT、BlendMask和SOLOv2,并在硬盘和手机数据集上进行了实验。结果表明,YOLOv8在精度和推理速度方面均表现最佳,适用于多任务场景,具备良好的泛化能力。未来的研究方向包括数据集扩展、模型优化和实际应用场景的落地。原创 2025-08-15 13:31:49 · 41 阅读 · 0 评论 -
11、显著性图评估指标:原理、应用与未来方向
本文深入探讨了显著性图评估指标的原理、应用与未来发展方向。重点分析了DAUC、IAUC、DC、IC和稀疏性等评估指标在事后通用解释方法和注意力架构中的应用,并讨论了当前指标体系存在的问题,如多部分注意力架构下指标应用的困难、OOD样本导致的不可靠性等。通过基准测试和相关工作分析,总结了显著性图评估的实际挑战和潜在改进方向。最后,提出了未来研究的重点,包括改进指标设计、优化解释方法以及加强模型校准等,旨在提高模型的可解释性和用户信任。原创 2025-08-14 13:59:58 · 43 阅读 · 0 评论 -
10、深度学习显著性图评估指标解析
本文深入分析了深度学习中显著性图的评估指标,重点探讨了现有指标DAUC和IAUC在生成分布外图像以及仅考虑像素得分排名方面的局限性。为解决这些问题,提出了三个新指标:稀疏性指标、Deletion Correlation(DC)和Insertion Correlation(IC),分别用于评估显著性图的聚焦程度和校准性。通过实验验证了这些指标的有效性,并给出了不同应用场景下的应用建议,最后指出了未来的研究方向,包括指标优化、用户研究和结合其他方法等,旨在推动深度学习模型的可解释性发展。原创 2025-08-13 11:09:36 · 81 阅读 · 0 评论 -
9、一种与传感器无关的多模态融合方案
本文提出了一种与传感器无关的多模态融合方案,用于人类活动识别。该方案通过特征级融合,将多个单模态分类器的输出进行整合,实现了在不同数量和类型传感器输入下的鲁棒识别性能。同时,文中介绍了一种数据增强方法,通过生成传感器数据的子集组合来提升在传感器数据有限情况下的模型表现。实验基于ExtraSensory数据集,结果表明该融合方法在整体测试集上取得了82%的准确率,并在传感器数量受限的情况下仍保持良好性能。此外,研究还揭示了类别不平衡问题,并提出了未来研究方向,包括类平衡方法和传感器贡献分析,以进一步提升模型的原创 2025-08-12 09:27:09 · 41 阅读 · 0 评论 -
8、图像与人类活动识别技术综述
本博客综述了图像处理与人类活动识别(HAR)领域的相关研究,重点介绍了图像金字塔、特征融合、传感器数据处理等关键技术。博客还探讨了单模态与多模态识别方法,并详细分析了数据融合和特征融合的具体实现及应用。此外,提出了一种传感器无关的多模态融合方案,并评估了数据增强方法在提升识别准确性方面的效果。研究结果显示,该方法在传感器数据缺失的情况下仍能显著提高模型准确性。最后,博客讨论了现有方案的局限性,并展望了未来的研究方向。原创 2025-08-11 12:28:19 · 36 阅读 · 0 评论 -
7、不规则金字塔图像处理技术解析
本文深入解析了基于不规则数据结构的LBP(局部二值模式)金字塔图像处理技术。文章详细介绍了LBP金字塔的构建与扩展过程,其保留关键点、对比度和细节的能力,以及在图像重建中的高视觉质量表现。同时,引入了斜率概念,探讨了其在图像区域识别、拓扑结构研究和优化过程中的应用潜力。相比传统方法如高斯金字塔和深度卷积神经网络,不规则金字塔在数据适应性、结构保留和并行处理方面具有显著优势,具有广泛的应用前景,包括医学图像处理、计算机视觉、遥感图像处理等领域。原创 2025-08-10 09:35:03 · 35 阅读 · 0 评论 -
6、拓扑保持图金字塔与局部二值模式的深入解析
本文深入解析了拓扑保持图金字塔和局部二值模式(LBP)在图像分析中的核心原理与应用。拓扑金字塔通过边收缩和扩展操作,保留图像的拓扑属性,并根据不同应用场景控制元素的合并与保留;而LBP则用于描述图像纹理特征,识别临界点,适用于不同维度的数据。文章还探讨了两者的综合应用案例及未来发展方向,为复杂图像处理任务提供了有效的理论和技术支持。原创 2025-08-09 10:04:36 · 54 阅读 · 0 评论 -
5、拓扑保持图金字塔的构建与控制
本文详细介绍了拓扑保持图金字塔的构建与控制方法,涵盖图收缩、收缩核、多重边和自环的简化、伪边的作用以及不规则金字塔的自底向上构建过程。同时,讨论了拓扑保持图金字塔在图像分割和图匹配等领域的应用,并分析了其优势、挑战及未来发展方向。该方法通过保持图的拓扑结构,实现了多尺度的抽象和简化,为图处理和图像分析提供了强有力的工具。原创 2025-08-08 16:19:10 · 39 阅读 · 0 评论 -
4、不规则金字塔:图像数据处理的新视角
本文介绍了不规则金字塔这一新型图像数据分层结构,探讨了其在图像处理中的独特优势。通过使用图结构和扩展区域邻接图(E-RAG),不规则金字塔能够根据数据需求调整自身结构,在自下而上的构建过程中保留重要信息并减少冗余。文章还回顾了其构建与重建过程,包括边收缩操作、简化处理和缩减函数的应用。此外,不规则金字塔支持大规模并行处理,并可与机器学习方法结合,为图像分析提供新的可能性。通过局部二进制模式(LBP)的应用,金字塔提取关键点结构及其邻接关系的能力得到了验证。原创 2025-08-07 09:12:59 · 90 阅读 · 0 评论 -
3、利用匹配图进行图增强
本文介绍了一种利用匹配图进行图增强的方法,并通过实验验证其在提升图神经网络分类器性能和稳定性方面的有效性。实验涵盖了三种GNN架构(SimpleF、GINF、GraphSAGEF)和四个图数据集(Mutagenicity、NCI1、COX-2、PTC(MR)),结果显示增强方法在多数情况下均能显著提升模型表现。此外,还探讨了该方法在小图数据集上的优越性,并分析了实验的局限性,提出了未来的研究方向,如扩展匹配图定义及与其他图神经网络结合。原创 2025-08-06 10:33:36 · 35 阅读 · 0 评论 -
2、基于匹配图的图数据增强技术研究
本文提出了一种基于匹配图的图数据增强方法,旨在解决图分类任务中训练集规模较小导致的性能问题。通过计算图编辑距离并利用近似算法(如BP算法)生成匹配图,从而扩展训练数据集。该方法在多个数据集上的实验表明,无论是支持向量机(SVM)还是图神经网络(GNNs),使用匹配图进行训练集增强均能显著提升分类准确率,尤其是在训练样本质量较差的情况下效果更为明显。此外,该方法增强了模型的稳健性,并具有广泛的应用前景,如化学分子分析、社交网络分析和图像识别等领域。原创 2025-08-05 14:42:39 · 34 阅读 · 0 评论 -
1、利用匹配图进行图数据增强
本博文介绍了一种基于匹配图的图数据增强方法,旨在解决监督模式识别中带标签训练数据有限的问题。通过利用图编辑距离和编辑路径信息,生成能够表示图对稳定核心的匹配图,并将其用于增强训练集,从而提升分类器的性能。实验结果表明,该方法在小图数据集上结合SVM分类器,以及在中等规模数据集上结合GNN分类器,均显著提高了分类准确率。未来的工作包括优化匹配图生成算法、探索更多数据集以及将该方法应用于更复杂的任务。原创 2025-08-04 13:26:54 · 31 阅读 · 0 评论
分享