- 博客(44)
- 收藏
- 关注
原创 多次霸榜CVPR最新idea-损失函数+注意力机制
例如,在NYUv2数据集上,与Cross-Stitch网络相比,MTAN在语义分割任务上的mIoU(平均交并比)提升了约3.2个百分点,在深度估计任务上的绝对误差降低了约0.014。:为1-Lipschitz网络提供了PAC学习理论支持,证明了在适当选择边际参数m的情况下,网络的VC维度是有限的,从而确保了网络在大样本情况下的学习能力。:在CIFAR-10数据集上,通过调整损失函数的超参数,1-Lipschitz网络能够达到与无约束网络相当的准确率,同时具有更高的鲁棒性。
2025-03-07 10:30:00
690
原创 域自适应多次登上A会!这些创新点赶快学起来!
域自适应(Domain Adaptation,DA)是迁移学习中的一个重要方法,旨在解决源域(Source Domain)和目标域(Target Domain)之间数据分布差异的问题。其核心思想是将源域上学习到的知识迁移到目标域中,以提升模型在目标域的性能我还整理出了相关的论文+开源代码,以下是精选部分论文更多论文料可以关注领取更多[论文+开源码】:提出了一种基于StyleGAN2的新型生成器结构,通过冻结预训练的源生成器并引入新的映射和仿射模块(M&A模块),在风格空间中实现目标领域的属性捕获。
2025-03-07 09:45:00
778
原创 万能涨点&创新点神器:对比学习12种创新!
在多个图基准数据集上,GraphACL显著优于现有的图对比学习方法。例如,在ScanNet数据集上,RegionPLC的训练成本仅为OpenScene的17%,存储需求仅为5%。例如,在ScanNet数据集上,与PLA相比,RegionPLC在未见类别的mIoU上提升了8.3%至21.8%。例如,在ScanNet数据集上,与单一语言对相比,融合后的性能提升了1.9%至3.5%。:VoCo框架简单易实现,同时在多个3D医学图像分析任务中表现出色,为自监督学习在医学图像分析中的应用提供了新的思路。
2025-03-06 10:12:09
750
原创 小波变换+CNN !完美结合再次登上顶会!
在CelebA和Helen数据集上,该方法在PSNR和SSIM指标上均优于现有的超分辨率方法,例如在16×16输入、8×放大倍数的情况下,PSNR达到26.61 dB,SSIM达到0.8949。在RAVDESS数据集上,该方法实现了81.45%的未加权准确率(UA)和81.22%的加权准确率(WA),优于现有的基于MFCC、梅尔频谱等特征的方法。改进的小波阈值方法提高了分类算法对不同去噪算法的鲁棒性,平均准确率比半阈值算法提高了8.36%–11.35%,比新阈值算法提高了1.75%–5.51%。
2025-03-06 10:09:12
1052
原创 超热门涨点思路!交叉注意力+特征融合结合,准确率近100%!
交叉注意力与特征融合的结合在多模态学习领域中是一种非常重要的技术,它通过注意力机制在不同模态之间建立联系,促进信息的交流和整合,显著提升了模型处理多模态数据的能力,尤其在图像融合、目标检测、点云分割等多个领域展现出强大的优势。提出了一种音频专用的CutMix方法,通过在时间轴上进行切割,防止模型过拟合,提升了音频分类任务的性能,mAP提升了4%(从39%提升到43%)。提出了一种包含两个编码器和一个解码器的变换器模型,分别用于处理3D点云和2D多视图图像,并在解码器中实现2D-3D特征的交织融合。
2025-03-05 10:27:05
837
原创 万能涨点神器-对比学习!2025将持续发力!
在多个下游任务中,TimesURL均取得了显著的性能提升。在测试集与训练集序列一致性低于50%的情况下,CLEAN的F1分数达到0.865,即使在10%序列一致性聚类下,F1分数仍能达到0.67,显著优于现有方法。在实验验证中,CLEAN成功纠正了被错误标注的酶(如MJ1651和TTHA0338),并准确预测了具有多种功能的酶(如SsFlA)的多个EC编号。建立了对比学习与互信息(MI)之间的理论联系,证明了InfoNCE损失是MI的一种更紧的估计,为对比学习的理论基础提供了新的解释。
2025-03-05 09:30:00
513
原创 特征融合狂发顶会,再出神作!2025最新创新点!
在BCI4-2A数据集上,TSFF-Net在仅使用三个通道的情况下,平均准确率达到了85.1%,超过了使用22个通道的经典算法。结合了对象特定的几何特征和DINOv2提供的语义类别先验,通过分层提取两种SE(3)不变的几何特征(成对距离和成对角度)来封装局部到全局的对象特定信息。提出了针对三通道运动想象EEG解码的网络架构,有效融合了时间-空间-频率特征,弥补了单模态网络在特征提取上的不足。动态权重因子通过自动调整任务权重,优化了特征交互,避免了手动调整的复杂性,进一步提升了模型的性能。
2025-03-04 09:50:09
791
原创 UNet+注意力机制双结合速度狂提98.82%!起步发一区!
UNet结合注意力机制是一种在图像分割任务中广泛应用的技术,通过引入注意力机制,能够显著提升模型对关键区域的关注度,从而提高分割精度和效率。我还整理出了相关的论文+开源代码,以下是精选部分论文更多论文料可以关注领取更多[论文+开源码】提出了一种改进的注意力Unet架构,用于3D MRI数据的全景分割。该架构通过增加编码器和解码器的层数,增强了特征提取和空间分辨率恢复能力。采用基于质心的掩码技术,结合椎体的面积和直径特征,为每个2D MRI切片生成掩码。
2025-03-04 09:47:13
811
原创 运筹学未来2-5年的研究热点方向!机器学习与运筹优化
在旅行商问题(TSP)、有容量限制的车辆路径问题(CVRP)和灵活流水线问题(FFSP)等多个典型组合优化问题上,与之前的修改方法相比,LCH-Regret显著缩小了与最优解的差距。:通过小的模型重构,开发了更强大的新算法,如大规模多核学习的半无限线性规划方法,以及利用问题结构改进排名和结构化输出的方法。针对现有机器学习模型,提出了更高效的优化方法,如改进的SVM优化算法,包括活动集方法和序列最小优化(SMO)方法的改进。
2025-03-03 11:04:59
776
原创 2025一区新风口:小波变换+KAN!定会顶刊轻松发!
通过组合B样条和高斯差分(DoG)的输出,FC-KAN在MNIST数据集上达到了97.93%的验证准确率,在Fashion-MNIST上达到了89.99%的验证准确率,显著优于其他KAN网络和MLP。提出了一种新的Kolmogorov-Arnold网络(FC-KAN),通过在低维数据中组合流行的数学函数(如B样条、小波和径向基函数)来捕捉输入数据的特征。KAN的可学习激活函数使得模型的内部机制和决策过程更加直观,提升了模型在需要高可解释性的领域的适用性,如医学诊断和金融预测。
2025-03-03 11:02:04
717
原创 多模态融合全新创新思路!2024顶会论文汇总!
多模态数据通常具有不同的物理性质和信息特征,通过融合这些多模态信息,可以获得更全面和准确的理解。在AV-MNIST、MM-IMDB和NTU RGB+D三个数据集上,发现的融合架构均达到了最先进的性能,例如在NTU RGB+D数据集上,平均准确率达到了90.04%,显著优于所有基线和竞争方法。提出了一种新的互补学习方法,分别提取每个模态的判别性和互补的共享和特定特征,进一步增强了cm-SSFT的有效性。提出的搜索空间是现代融合方法的超集,允许更灵活的融合架构设计,同时保持了问题的复杂性在可管理的范围内。
2025-02-28 10:02:47
917
原创 注意力机制+傅里叶变换 高效又涨点!2025发文热点!
例如,在1024×1024分辨率下,ZITS++的PSNR达到29.03,SSIM达到0.925,FID降低到14.72。在ImageNet数据集上,GFNet-XS模型在224×224分辨率下达到78.6%的Top-1准确率,比ResMLP-12高出2.0%,GFNet-B达到80.7%,优于DeiT-B(81.8%)等模型。TSR模块能够更准确地恢复结构先验,如边缘和线段,与之前的方法相比,结构恢复的F1分数显著提高,例如在Indoor数据集上,L-Edge的F1分数从28.55提升到52.07。
2025-02-28 10:00:19
596
原创 多模态可解释性的创新方案!超好发定会顶刊的创新点!
多模态模型在音乐流派和情感分类任务中表现优于单模态模型,例如在Music4All数据集上,多模态模型在情感分类任务中达到了48.53%的准确率,相比歌词模型(32.33%)和音频模型(48.29%)均有提升;实验表明,使用更大规模的语言解码器(如13B模型)可以显著提升多模态推理性能,与7B模型相比,准确率提升了近5%,这为未来使用更大模型进行科学多模态任务提供了有力支持。提出了FakeBench,一个多模态数据库,包含详细的文本真实性描述,用于探测大型多模态模型(LMMs)在假图像检测中的表现。
2025-02-27 10:07:39
711
原创 U-Net+CNN 2025最新创新性用于图像分割
相比仅使用UNet或SwinUNet的弱监督框架,Weak-Mamba-UNet在多个评估指标上表现出色,例如平均Dice系数提升了约2%~3%,Hausdorff距离降低了约50%,平均表面距离降低了约50%。例如,在红外乳腺图像数据集上,DC-UNet的分割准确率比U-Net提高了2.90%,比MultiResUNet提高了1.20%。通过加权损失函数改善了细胞分割中接触物体的分离效果,例如在ISBI细胞跟踪挑战中,U-Net的平均交并比(IOU)达到92.03%,显著优于第二名的83%。
2025-02-27 09:00:00
951
原创 2025最新方案!Mamba赋能UNet!轻松实现高效分割!
Mamba+UNet 是一种结合了状态空间模型(Mamba)和经典 UNet 架构的创新模型,旨在提升图像分割任务的性能。我还整理出了相关的论文+开源代码,以下是精选部分论文更多论文料可以关注领取更多[论文+开源码】引入视觉状态空间块,用于捕获广泛的上下文信息,通过2D选择性扫描模块(SS2D)处理输入数据。增强低级和高级特征的融合,通过注意力机制对特征图进行空间和通道注意力计算,调整特征图的尺寸以匹配目标参考。
2025-02-26 09:47:29
1022
原创 2025创新idea!线性注意力机制狂发顶会!
ALiBi在训练时使用的输入序列长度为1024,但在测试时能够处理长度为2048的序列,并且在困惑度上与训练长度为2048的正弦位置编码模型相当,同时训练速度提升11%,内存使用减少11%。在训练时,Griffin与Transformer的硬件效率相当,且在推理时具有更低的延迟和更高的吞吐量。在训练时使用的token数量比Llama-2少6倍的情况下,Griffin匹配了Llama-2的性能。通过增强的线性注意力,模型能够支持更长的序列长度(从8K扩展到32K),同时显著降低延迟和内存使用。
2025-02-26 09:30:00
982
原创 全新Attention:边界注意力,能发TNNLS的idea!
边界注意力(Boundary Attention)是一种新型的注意力机制,主要用于从图像中检测和推断边界结构,包括边缘、角点、交叉点等。我还整理出了相关的论文+开源代码,以下是精选部分论文更多论文料可以关注:AI科技探寻,发送:111 领取更多[论文+开源码】标题:Boundary-Aware Axial Attention Network for High-Quality Pavement Crack Detection用于高质量路面裂缝检测的边界感知轴向注意力网络方法:位置引导的轴向注意力模块(PAA
2025-02-25 10:38:17
939
原创 PINN再登Nature!2025持续发力!
通过稀疏回归得到的PDE系数具有明确的物理意义,能够直接揭示系统的物理规律,例如在细胞迁移和增殖实验中,成功发现了与Fisher-Kolmogorov模型一致的PDE。在没有高分辨率训练数据的情况下,PINO能够通过PDE约束预测超出训练数据分辨率的解,且在Kolmogorov流问题中,与仅使用数据驱动方法相比,误差显著降低。相比传统的SINDy方法,PINN-SR能够在数据稀疏和噪声较高的情况下准确发现PDE,例如在10%噪声水平下,Burgers方程的发现误差仅为0.88%。
2025-02-25 10:32:29
1009
原创 PINN和GNN结合创新发Nature,性价比太高了吧!
一个涨点发顶会的好方向:PINN+GNN!PINN网络的研究热度持续上升,GNN的引入更是将PINN的卓越建模能力和GNN在图结构数据处理上的优势相结合,共同推动了模型性能的提升,以及在解决复杂物理问题时的效率和精确度。具体数据表现为,在1D Advection方程的前向问题中,PINNACLE能够学习到所有条纹的原始解,而基准算法只学习到了靠近IC的几个条纹。PINO是第一个结合数据和不同分辨率的PDE约束来学习算子的混合方法,能够在低分辨率训练数据的情况下实现高精度的解算子近似。
2025-02-24 10:47:12
977
原创 KAN+LSTM新出的创新结合就等顶会了?2025最好发的论文创新点
在加密货币市场的测试中,动态模型的平均预测误差比静态模型降低了约30%。通过引入时间变化的转移概率和外部协变量,增强了状态空间模型对市场动态变化的捕捉能力,相比传统静态模型,能够更好地适应加密货币市场的高波动性和复杂性。TDNN通过时间卷积层捕捉期权价格的时间动态特性,虽然在某些指标上不如混合RNN,但相比传统方法仍表现出显著的性能提升,平均误差降低了约20%。由于不同模型在不同市场条件下的误差具有互补性,研究提出了模型集成的可能性,通过结合多个模型的优势,有望进一步提升预测精度和鲁棒性。
2025-02-24 10:40:13
1028
原创 CNN+LSTM+Attention强强结合!创新性拉满!内附创新点
在Flickr8K数据集上,Bi-LSTM模型在BLEU-N评估中达到了61.9/43.3/29.7/20.0的成绩,而使用VggNet的Bi-LSTM模型在MSCOCO数据集上达到了67.2/49.2/35.2/24.4的成绩,显示出显著的性能提升。提出了两种新型的深度双向变体模型,通过不同方式增加非线性转换的深度,以学习层次化的视觉-语言嵌入,这在图像描述生成和图像-句子检索任务中取得了竞争性的性能,即使没有集成额外机制(例如目标检测、注意力模型等)。
2025-02-23 10:00:00
1072
原创 神思路:小波变换+CNN!最新idea躺进顶会!
实验表明,即使在只有少量短时训练样本的情况下,提出的混合架构也能成功执行有效的特征提取,相对改进了约20%(Librispeech数据集上,相比于CNN-raw和SincNet)。:在16×16或更小像素尺寸的非常低分辨率人脸图像上实现了高达16倍的放大,且在定量和定性上都优于现有的超分辨率方法。:小波变换的应用揭示了在处理不平等类分布时,CNN模型的局限性,为未来的空气质量预测系统提供了改进的方向。:小波散射变换减少了CNN第一层的不稳定性,并扩展了MFCC表示,没有丢失信息,提供了更丰富的特征表示。
2025-02-23 10:00:00
1052
原创 频域+特征融合新突破,让顶会投稿轻松涨点
在三个数据集上的实验结果表明,STeInFormer在效率-准确性权衡方面超越了现有的最先进方法,例如在WHU-CD数据集上,相比于DMATNet方法,F1分数提升了3.5%,达到了89.61%。Bi-FCFM性能提升:Bi-FCFM在Echo-KITTI数据集上相比于其他融合模块(如Vanilla-CAtt、Bi-XAtt、DWT-CAtt、FFT-CAtt)在HOTA、DetA、AssA、MOTA和IDF1等指标上分别提升了3.08%、0.47%、0.44%、0.99%和4.71%。
2025-02-23 09:00:00
782
原创 Clip+小样本学习 顶会顶刊轻松发!
在11个基准数据集上进行了广泛的实验,证明了KCL作为无需训练的即插即用模块在零样本和少样本学习任务中的有效性,与原始方法相比,KCL在1-shot设置中平均提升了3.04%-3.60%,在2-shot设置中提升了1.90%-5.20%,在4-shot设置中提升了1.32%-4.69%。基于对逻辑偏差关键组件的分析,提出了高效的AMU-Tuning方法,其核心是通过利用适当的辅助特征和多分支训练的特征初始化线性分类器来学习有效的逻辑偏差,然后通过基于不确定性的融合进行少样本分类。
2025-02-22 10:00:00
743
原创 多模态才是大模型当下的趋势!论文分享附idea
这种对应关系可以是时间维度的(如视频中的画面与声音的时间同步),也可以是空间维度的(如图像中的区域与文本描述的对应)。通过计算图像令牌和文本令牌之间的相似度来选择相关的图像块,提高了模型对图像和文本之间相关性的理解,例如在Flickr-30k数据集上的图像-文本检索任务中,mTR/mIR性能提升了+5.1%/3.7%。在十二个NLG任务上的广泛实验表明,ZeroNLG在没有任何标记的下游数据对训练的情况下,生成了高质量和“可信”的输出,并显著优于现有的零样本方法。
2025-02-22 10:00:00
903
原创 LSTM和注意力机制相结合!创新点轻松出!
通过结合扩张卷积和注意力机制,模型在StateFarm数据集上实现了95.8367%的准确率,在Drive&Act-Distracted数据集上实现了97.8911%的准确率,显著提高了驾驶行为识别的准确性。通过使用多头注意力机制,IMA-LSTM模型能够更精细地模拟车辆间的时空交互特征,与不考虑多车交互特征的模型相比,在不同场景下平均减少了42.85%至47.06%的预测误差。通过在Bi-LSTM模型结构中引入注意力机制,计算Bi-LSTM模型状态之间的不同权重,显著提升了模型的特征表达能力。
2025-02-21 10:19:29
830
原创 小样本机器学习再发力!2025再登Nature正刊!
小样本机器学习(Few-Shot Learning, FSL)是一种在仅有少量标注样本(通常为几个到几十个)的情况下,训练机器学习模型以完成新任务的方法。我还整理出了相关的论文+开源代码,以下是精选部分论文更多论文料可以关注领取更多[论文+开源码】提出了一种基于生成式Transformer的基础模型TabPFN,通过在数百万个合成数据集上进行预训练,学习解决表格数据预测任务的通用算法。利用上下文学习机制,使模型能够在单次前向传播中完成对新数据集的训练和预测,无需针对每个数据集单独训练模型。
2025-02-21 10:00:00
937
原创 LSTM+Transformer王炸创新,轻松登顶顶会!!
深度LSTM能够支持高达24层的深度Transformer的收敛,而12层使用深度LSTM的Transformer已经达到了24层普通Transformer的性能水平,表明深度LSTM在参数使用上比基线方法更高效。提出了一种将深度LSTM与Transformer层和子层连接的方法,将堆叠Transformer层的输出视为时间序列中的步骤,并管理层内和层间的表示聚合。训练一个带有注意力机制的双向长短期记忆(Bi-LSTM)模型,该模型包含两个LSTM层,分别处理输入序列的正向和反向,以捕获双向依赖关系。
2025-02-21 09:45:05
1049
原创 多尺度特征融合太好出论文了!轻轻松松登Nature
多尺度特征融合是一种在计算机视觉领域广泛应用的技术,其核心思想是将不同尺度的特征图进行融合,以提高模型对目标的检测、分割或识别能力。今天就多尺度特征融合整理出了论文+开源代码,以下是精选部分论文 更多论文料可以关注:AI科技探寻,发送:111 领取更多[论文+开源码】 论文解读:多级特征融合(HS-FPN):设计了高阶筛选特征融合金字塔(HS-FPN),通过通道注意力模块利用高层特征作为权重筛选低层特征信息,并将其与高层特征合并,增强模型的特征表达能力。可变形自注意力机制:在编码器中引入多尺度可变形自
2025-02-20 10:14:21
937
1
原创 CNN+LSTM+Attention热门buff叠满!顶会直接冲!内附创新点!
提出的CNN-LSTM-A模型在预测压力波动方面优于传统的深度学习模型(如SVM和BPNN),在无负载条件下,模型的RMSE和MAE值比有负载条件分别低0.0015 MW和0.0039 MW,表明模型在复杂工况下具有更高的预测精度。在CNN-LSTM模型中引入注意力机制,增强了模型对近距离FBG传感器检测到的冲击信号TDOA的重要性,从而提高了模型对冲击位置的敏感性和定位精度。引入注意力机制后,模型能够更准确地分配权重,加快误差收敛速度,降低误差值,显著提高了模型对压力信号预测的准确性和泛化能力。
2025-02-20 10:10:29
758
原创 小样本学习多次登上Nature!这么好的创新点还不赶快来看看吗?
小样本学习(Few-Shot Learning, FSL)是一种机器学习框架,旨在利用极少量的标注样本(通常是1到10个)来训练模型,使其能够对新任务或新类别进行准确预测。今天分享的就是关于小样本的论文解读。我还整理出了相关的论文+开源代码,以下是精选部分论文更多论文料可以关注领取更多[论文+开源码】
2025-02-19 10:43:07
961
原创 2025新风向聚类+Transformer创新结合!发A会根本不用愁!
聚类+Transformer”是一种结合聚类算法和Transformer架构的创新方法,近年来在多个领域取得了显著的研究进展和应用成果。我还整理出了相关的论文+开源代码,以下是精选部分论文更多论文料可以关注领取更多[论文+开源码】
2025-02-19 10:31:26
1358
原创 特征融合狂发顶会,再出神作
在BCI4-2A数据集上,TSFF-Net在仅使用三个通道的情况下,平均准确率达到了85.1%,超过了使用22个通道的经典算法。结合了对象特定的几何特征和DINOv2提供的语义类别先验,通过分层提取两种SE(3)不变的几何特征(成对距离和成对角度)来封装局部到全局的对象特定信息。提出了针对三通道运动想象EEG解码的网络架构,有效融合了时间-空间-频率特征,弥补了单模态网络在特征提取上的不足。动态权重因子通过自动调整任务权重,优化了特征交互,避免了手动调整的复杂性,进一步提升了模型的性能。
2025-02-18 10:01:31
821
原创 多模态大模型-clip改进新思路!狂发A会!
CLIP 的核心思想是通过大量的图像和文本对进行训练,使得匹配的图像和文本在嵌入空间中彼此靠近,而不匹配的则远离。这种模型可以用于多种任务,如零样本图像分类、图像搜索和特征提取我还整理出了相关的论文+开源代码,以下是精选部分论文更多论文料可以关注领取更多[论文+开源码】
2025-02-18 09:58:06
620
原创 Deepseek改论文这么简单?四个方法帮你改出完美SCI论文!
DeepSeek的横空出世打乱了AI圈原本的安宁,我趁着这段时间总结了一套deepseek的论文王炸打法,亲测用这个方法改论文,起码省下三四天的时间,需要的朋友速码~确保每个论点都有充分的证据和解释支持如果某个部分或论点跳跃性较大,可能需要添加更多细节或背景信息来填补逻辑上的空白,确保论文的完整性和深度。如有必要,考虑重组论文。为论文及其各部分选择具有指导性和信息性的标题,这些标题应准确反映每部分的核心内容并引导读者的注意力。选择明确无误的词汇,避免可能引起多种解释的词语确保论文的意图被准确传达,
2025-02-17 10:28:21
1129
原创 机器学习热门创新点-Shap可解释性!轻松拿下多个一区!
SHAP(SHapley Additive exPlanations)是一种基于博弈论的机器学习模型可解释性方法,用于解释模型预测结果。其核心是通过计算每个特征的Shapley值,量化特征对模型输出的贡献。我还整理出了相关的论文+开源代码,以下是精选部分论文更多论文料可以关注领取相关[论文+开源码】
2025-02-17 10:24:36
1069
原创 特征融合新技术——自适应特征融合!高效又涨点!
自适应特征融合(Adaptive Feature Fusion,AFF)是一种深度学习中的特征处理技术,它通过动态调整特征融合过程来提高模型的泛化能力和性能表现,今天分享的就是关于自适应特征融合的论文解读。我还整理出了相关的论文+开源代码,以下是精选部分论文更多论文资料可以关注领取相关[论文+开源码】
2025-02-14 10:24:38
1987
原创 2025Idea黑马因果机器学习!多篇文章轻松登上Nature!32/64
因果机器学习(Causal Machine Learning, CausalML)是将因果推断与机器学习相结合的前沿技术,旨在通过建立因果关系模型,深入探索数据背后的深层联系,从而更准确地预测和决策。我还整理出了相关的论文+开源代码,以下是精选部分论文更多论文资料可以关注领取相关[论文+开源码】
2025-02-14 10:17:57
1249
原创 2025机器学习热门方向,shap可解释性+聚类分析!附全新idea
论文1SHAP(SHapley Additive exPlanations)可解释性与聚类分析的结合是当前机器学习可解释性研究的热门方向之一。这种结合不仅能深入理解模型的决策过程,还能通过聚类揭示数据中的潜在模式,进一步提升模型的可解释性和性能。我还整理出了相关的论文+开源代码,以下是精选部分论文更多论文资料可以关注领取相关[论文+开源码】论文1基于Shapley值的可解释人工智能在故障诊断和预测中的聚类应用利用Shapley值对特征贡献进行量化,为聚类提供解释性支持。
2025-02-13 13:51:04
1182
原创 准确率接近百分百的组合:交叉注意力+特征融合
在Flickr30K数据集上,图像到句子检索的R@1、R@5、R@10指标分别达到74.2%、92.8%、96.4%,句子到图像检索的R@1、R@5、R@10指标分别达到54.8%、81.4%、87.8%,在MS-COCO数据集上,图像到句子检索的R@1指标比最佳基线提高了3.6%,句子到图像检索的R@1指标提高了3.8%。:将图像区域和句子词的特征堆叠后输入Transformer单元,通过交叉注意力机制同时考虑模态间和模态内的关系,以增强图像和句子的匹配能力。
2025-01-15 16:51:51
1300
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人