自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(138)
  • 收藏
  • 关注

原创 Mamba再出手!助力图像增强提速21倍,Transformer时代终结?

而FusionMamba创新性地融合多模态医学影像(如CT-MRI),通过跨模态动态特征增强模块,显著提升病灶边界的细节还原能力。文章提出Fusion-Mamba方法用于跨模态目标检测,设计FMB块融合特征,在多个数据集上进行实验,验证其在减少模态差异、提升融合效果和检测性能方面的优势。该模型整合多种技术,利用多模态数据提升预测精度,经实验验证效果优于多种先进方法,为 AD 诊断提供新途径。首次探索Mamba在跨模态融合中的潜力,构建隐藏状态空间减少特征差异,增强融合特征的一致性。

2025-04-03 20:00:00 292

原创 跨模态对齐技术革新!CRA框架让视频问答准确率飙升2.2%,可解释性MAX!

通过HDI获取多层级数据,ICMA策略建立特征连接,OFCA模块优化特征,在多个数据集实验,验证其相比现有方法在检测性能上的优势。在ScanNet和SUN RGB-D等数据集上实验,对比多种方法,使用AP、mAP等指标评估,进行消融实验分析各组件作用。它学习统一的模态无关嵌入空间,支持场景检索和对象定位,在ScanNet和3RScan数据集上进行实验,验证了其性能优势。利用预训练2D目标检测器生成2D边界框,投影到3D空间获取3D边界框,监督3D物体定位。

2025-04-02 20:00:00 271

原创 异常检测技术的“效率革命”,学会这些轻松发一区!

最新研究显示,基于自监督学习与图神经网络的混合模型在工业设备故障预测中实现98.7%准确率,微软团队更将金融欺诈检测误报率降低60%,阿里云工业质检系统借助多模态时空建模,使缺陷识别速度提升4倍。通过强化学习引导生成模型合成多样且具挑战性的异常样本,结合Mamba模型的混合专家结构进行检测,在ADBench基准测试上验证了该框架的有效性。这些创新不仅提升了异常检测的准确性,还优化了计算资源的使用,为异常检测技术在实际应用中的推广和深化提供了有力支持。

2025-04-01 20:00:00 274

原创 AI设计AI?神经架构搜索让算法进化自动化,人工调参时代终结!

例如,ATLAS方法通过两阶段过滤和精化优化方案,结合无训练和基于训练的架构评估方法,显著减少了表格数据上的搜索时间,最高可达82.75倍。此外,NAS-NGE方法通过使用标准化偏差和神经切线核(NTK)的标准化第二阶矩的替代品,提供了一种更有效的结构搜索方法,显示出在短时间内搜索的优势。通过为不同节点定制聚合方法,在多个任务中进行实验,验证其在分布外泛化方面的优势,为提升图神经网络性能提供新思路。设计自适应聚合注意力机制,分离度分布和不同的同配性,进行多维度架构搜索。

2025-03-31 20:00:00 266

原创 10个创新idea!少样本目标检测,利用3%数据,达到95%性能!

论文提出SMILe框架用于少样本目标检测,通过组合互信息函数和子模信息函数构建联合目标函数,解决类别混淆和灾难性遗忘问题,在PASCAL-VOC和MS-COCO数据集上进行实验,验证了该框架的有效性。在1-shot和5-shot场景下,检测精度分别提升了10%和8%。此外,通过数据增强和自监督模型的应用,仅使用3%的数据就能达到80%的准确率,相当于使用全尺寸数据训练的。不同数据增强策略在不同数据集和训练场景下表现不同,自动数据增强方法在部分场景有优势,定制增强策略在特定数据集的低样本情况下表现较好。

2025-03-28 20:00:00 309

原创 遥感技术新突破!极低码率压缩,重建质量提升40%!

该模型结合了矢量地图的语义信息和预训练扩散模型的生成能力,实现了在极低码率条件下的高质量遥感影像重建。文章聚焦光学遥感中反射率术语和产品缺乏标准化的问题,明确定义相关反射率量,结合案例分析当前使用情况,对比不同反射率产品,强调标准化的重要性。这些创新不仅提升了遥感数据的处理效率,还为遥感技术在环境监测、灾害预警、资源管理等领域的应用开辟了新的可能性。利用 MISR 数据,统计分析不同反射率产品间的差异,并探究其与气溶胶光学深度等因素的关系。研究员团队在极低码率遥感图像压缩方面取得了显著进展,提出了一种。

2025-03-27 20:00:00 323

原创 ICLR 2025 高分论文!当扩散遇上Transformer,生成质量狂飙,效率提升50%!

最新研究表明,通过将扩散模型的逐步生成能力与Transformer的自注意力机制相结合,模型在。构建了高质量的大规模训练数据集Vchitect T2V DataVerse,提升模型训练和泛化能力。提出了基于混合并行主义和内存优化技术的高效训练框架,支持长视频序列的分布式训练。设计了多模态扩散块以确保文本描述与生成视频帧之间的一致性,并保持时间连贯性。创建包含严格注释和美学评估的百万级高质量数据集,支持复杂任务的训练。结合数据并行和序列并行技术,使用重计算和卸载等方法优化内存消耗。

2025-03-26 20:00:00 358

原创 图像逼真度高达90%!扩散模型+文本图像生成,AI绘画商业化落地加速!

最新研究显示,通过将文本生成技术与先进的扩散模型深度融合,不仅能够根据用户输入的简单文本快速生成高质量、高分辨率的图像,还能在生成过程中实现对细节和风格的精准控制。基于深入分析关键组件如文本编码器和VAE,提出DiT-Air和DiT-Air-Lite,分别在GenEval和T2I CompBench上达到SOTA性能。从艺术创作到商业设计,从虚拟现实到游戏开发,文本图像生成与扩散模型的结合正为视觉内容的智能化创作开辟无限可能,开启创意表达的新纪元。紧凑型模型DiT-Air-Lite仍能超越大多数现有模型。

2025-03-25 20:00:00 247

原创 效率提升50%!物理信息强化学习新高度,智能决策准确率狂飙!

例如,在智能控制和机器人任务中,PIRL不仅将模型的训练效率提升了40%,还将决策的准确性提高到95%以上,显著优于传统方法。本文研究二维含圆形障碍物平面中多无人机追逃策略,将任务分包围和追逃两阶段,设计相应算法,通过仿真分析各因素影响,PPO 在多智能体合作任务中,最终回报和样本效率可与前沿算法相媲美,能作为有力的基线算法。确定影响 PPO 性能的五个关键因素,并给出最佳实践建议,增强其在多智能体场景的实用性。在多智能体合作场景中的性能,通过实验证明其表现出色,并分析影响其性能的关键因素,为。

2025-03-24 20:00:00 548

原创 效率狂飙40%!时间序列+聚类,轻松发顶会!

文章回顾并评估了用于时间序列聚类的弹性距离函数,对比9种弹性距离函数在k-means和k-medoids聚类算法下的表现,发现MSM和TWE表现更优,并给出实验结论与应用建议。文章提出一种受时间序列技术启发的定时序列聚类方法,将drop-DTW和DBA方法应用于医疗护理路径分析,通过实验验证其有效性,并探讨了方法的优缺点和未来研究方向。在UCR数据集上,k-medoids聚类器结合弹性距离函数的效果优于k-means,更适合时间序列聚类。的应用提供了更精准的解决方案,开启了数据分析的新篇章。

2025-03-23 20:00:00 278

原创 不卷好发的idea!KAN+特征提取,推理速度提升30%!

提出多种 KAN 变体,如 T-KAN、Wav-KAN 等,适应不同任务需求,提升在动态环境、高维数据处理等方面的性能。正在成为研究热点,为复杂数据处理带来新的突破。提出基于 KAN 的多编码器 - 单分类器架构的 iKAN 框架,用于跨异构数据集的增量学习,减少灾难性遗忘。

2025-03-22 20:00:00 264

原创 医学图像分割新突破!SAM模型让病灶检测精度提升35%

通过设计多尺度提示生成器和3D深度融合适配器,该框架能够自动生成辅助掩码、边界框和中心点提示,并使预训练的2D SAM模型适应3D医学图像分割任务。该方法解决了传统多选择学习(MCL)在医学图像分割中的局限性,包括固定输出数量和稀疏损失函数导致的预测头主导问题,同时支持任意数量的掩码生成。从肿瘤检测到心血管分析,SAM与医学图像分割的结合正在为医疗影像智能化注入新的活力,开启精准医疗的新篇章。设计了3D深度融合适配器,并将其注入到SAM的图像编码器和掩码解码器中,以支持3D医学图像分割。

2025-03-21 20:00:00 369

原创 2025中科院分区表公布!

2025中科院分区表正式发布!

2025-03-20 18:22:05 321

原创 多模态大模型杀疯了!性能提升70%,跨模态检索的“硬核”突破!

本文系统研究了多模态融合架构设计对3D异常检测(3D-AD)的影响,提出了一种新的神经架构搜索方法3D-ADNAS,首次同时搜索多模态融合策略和模态特定模块,显著提升了3D-AD在精度、帧率和内存使用方面的性能,并展现出处理小样本任务的潜力。这种创新不仅优化了数据处理效率,还让机器能够更自然地理解和交互,为人工智能的未来发展开辟了新的路径,开启了智能技术的多模态新时代。3D-ADNAS方法能够高效搜索出适合3D-AD的多模态融合架构,在多种任务中表现优异。

2025-03-19 20:00:00 422

原创 3倍训练速度+40%显存节省!Mamba+Transformer 仅用一半时间,性能提升80%!

通过结合Vision Mamba、卷积网络和Transformer的优势,有效捕获全局与局部信息,从而提升机器人视觉抓取在复杂场景中的适应性、精确性和灵活性。的效率提升了50%,同时在语言生成和图像识别任务中的准确率达到了惊人的95%。通过探索不同粒度下组件移除对模型大小和计算开销的影响,提出了一种名为Mamba-Shedder的剪枝方案,在保持精度的同时显著提升模型效率。Mamba与Transformer的结合,正在为多模态智能系统的发展注入新的活力,开启智能技术的全新篇章。

2025-03-18 20:00:00 438

原创 训练成本砍半!DeepSeek背后的“硬核”技术,让AI性能飞跃!

本文探讨了在CIFAR-10数据集上优化Tiny ViT的设计方法,通过数据增强、低秩压缩和多类标记策略等手段提升模型性能,并揭示了Transformer中存在冗余信息的可能性,为高效设计小型ViT提供了框架与洞见。DeepSeek-VL2是一系列先进的大型MoE视觉-语言模型,通过动态拼接视觉编码策略和Multi-head Latent Attention机制,在视觉和语言组件上实现了显著改进。这种创新不仅为AI模型的性能提升提供了新的思路,也为未来智能系统的发展注入了强大动力。

2025-03-17 20:00:00 392

原创 CVPR满分!数据蒸馏大突破,仅用20%数据,模型准确率提升10%!

本文提出了一种任务无关的提示压缩方法LLMLingua-2,通过数据蒸馏和双向上下文建模,显著提升了提示压缩的效率和保真度。最新研究展示了如何通过数据蒸馏,从海量的标注数据中提取最具代表性的样本,构建出更高效、更紧凑的训练集。例如,在大规模图像分类任务中,经过蒸馏的数据集让模型在仅使用20%数据的情况下,通过优化上下文数据,ICD显著提升了TabPFN的性能,使其在48个大型OpenML数据集上表现优异。本文提出了一种新的上下文数据蒸馏方法(ICD),用于扩展TabPFN模型处理大规模表格数据的能力。

2025-03-14 20:00:00 363

原创 传统算法被吊打!特征融合+GNN,模型准确率狂飙至95%!

文章提出一种基于图的语音特征融合方法用于语音情感识别,通过学习多维边特征描述特征间关系,在SEWA数据集上取得良好效果,验证了方法的有效性。最新研究表明,通过将多源特征进行深度融合,并利用GNN的强大图结构建模能力,模型在处理节点分类、图预测等任务时的性能显著提升,特征融合与GNN的结合,正以强大的技术优势,为智能系统的发展注入新的活力,开启数据驱动智能决策的新篇章。使用结构感知Transformer层,结合GNN的消息传递机制和LLM的自注意力机制,处理图结构和文本信息。

2025-03-13 20:00:00 361

原创 抛弃固定参数!自适应小波网络创新,训练成本直降40%!

这种创新结合了小波变换的多尺度分析能力和神经网络的自适应学习特性,能够自动调整小波基函数和网络参数,从而更高效地处理复杂信号和图像数据。通过设计特殊模块提取融合特征,采用复合损失函数训练网络。设计多个功能模块,如 APRB 自适应提取多尺度特征,ASIFB 融合相邻尺度信息,CMAB 增强特征,CRB 减少图像差距。通过频域转换管道和多级特征聚合模块,在多个数据集上进行实验,验证了模型在去噪性能和资源效率上的优势。设计频域转换管道,利用小波变换可逆性,在降分辨率同时保留图像特征,减少内存消耗。

2025-03-12 20:00:00 399

原创 突破极限!卡尔曼滤波+LSTM,让预测误差直降80%!

本文提出了一种数据驱动的方法,通过结合Transformer和Kalman滤波器(TKF)来提高分布式直流微电网对网络攻击(如FDI、DoS和延迟攻击)的弹性。卡尔曼滤波以其高效的递归滤波特性,能够实时处理动态系统中的噪声数据,而LSTM则凭借其强大的时间序列建模能力,能够捕捉数据中的长期依赖关系。结合了Kalman滤波的降噪能力、连续小波变换的时间频率分析能力和LSTM对时序依赖性的建模能力。研究结果表明,结合降噪、时间频率分析和复杂序列建模的方法可以显著提升建筑能耗预测的准确性。

2025-03-11 20:00:00 469

原创 视觉语言模型新突破!苹果开源AIMv2,多模态融合性能提升10%!

实验结果表明,VisualGPT在仅使用 0.1%、0.5% 和 1% 的训练集时,性能显著优于多个基线模型,CIDEr评分在MS COCO上提升了10.0%,在Conceptual Captions上提升了 17.9%。PaLI的训练数据集包含超过100种语言的100亿张图像和文本,通过大规模多语言混合训练,提升了模型的多语言能力和多模态理解能力。PaLI采用自监督和全监督的混合训练方法,通过对比预训练的视觉模型和语言模型,实现了在多种任务上的性能提升。

2025-03-07 20:00:00 404

原创 NeurIPS新成果!扩散强化学习大突破,算法性能提升124.7%!

在简单的2D多模态行为策略强化学习任务中验证了Diffusion-QL的优越性,并在D4RL基准测试任务上取得了最先进的性能。Diffusion-QL通过学习动作价值函数,并在条件扩散模型的训练损失中加入最大化动作价值的项,从而优化策略。首次将扩散模型用于强化学习中的动作生成,通过去噪扩散过程优化策略,显著提升了策略的稳定性和性能。引入能量模型来评估动作的合理性,通过能量优化找到更“合理”的动作,帮助模型生成高质量的动作序列。在去噪的每一步,模型计算当前动作的能量梯度,并沿着降低能量的方向调整动作。

2025-03-06 20:00:00 652

原创 抛弃传统AI!BNN创新成果登上TPAMI,准确率提升93%!

通过理论分析和实验验证,文章表明BNNs在数据流形上的梯度期望为零,从而提供了对抗攻击的鲁棒性保证。通过理论推导,证明了在无限宽神经网络和大量数据的极限情况下,BNNs对基于梯度的对抗攻击具有鲁棒性。证明了在无限宽神经网络和大量数据的极限情况下,BNNs对基于梯度的对抗攻击具有鲁棒性。证明了在无限宽神经网络和大量数据的极限情况下,BNNs对基于梯度的对抗攻击具有鲁棒性。通过实验验证了BNNs在对抗攻击下的鲁棒性,并展示了其在高精度和鲁棒性之间的正相关性。

2025-03-05 20:00:00 353

原创 小目标检测的终极答案?Transformer+Swin架构,COCO数据集mAP突破60%!

在SIRST、NUDT-SIRST等数据集上,检测率(Pd)达98.2%,误报率(Fa)降低至0.05%,显著优于传统算法(如Max-Median)和主流深度模型(如ACM、ALCNet)。通过混合生成和同步机制,有效解决了雷达点云稀疏性和角度估计误差的问题,显著提升了3D目标检测的性能。旨在解决传统方法在复杂背景、低信噪比场景下对小目标(如无人机、导弹尾焰)检测精度低、误报率高的问题。基于状态空间模型(SSM)的动态权重分配,减少冗余计算,较Transformer节省40%+计算量。

2025-03-04 20:00:00 467

原创 因果机器学习登Nature!反事实推理让诊断准确率飙升至77.26%!

因果机器学习(Causal ML) 近期取得突破性进展,核心创新包括:√结构因果模型自动化:谷歌团队提出DAG-Transformer,利用注意力机制从高维数据中自动学习因果图结构,在合成数据集上F1值达0.89;√反事实可解释性增强:清华团队的Counterfactual-GAN生成对抗样本揭示模型决策因果路径,在自动驾驶场景中误判率下降35%;√动态因果强化学习:DeepMind的CausalDQN通过因果干预实现策略可迁移性,在机器人操控任务中跨场景成功率提升58%。

2025-03-03 20:00:00 337

原创 LoRA技术升级!LoRA-RITE在Gemma-2B上实现4.6%准确率提升!

该论文指出,PEFT技术通过减少可训练参数和计算开销,在微调过程中展现出显著的成本效益,同时能够达到接近全量微调的性能。证明了PEFT在低数据场景和分布外任务中的优越性能,提升了模型泛化能力。PEFT在低数据场景和分布外任务中表现出色,适合地震反演领域的实际应用。提出了适用于不同地质特征的任务无关基础模型,超越了特定任务模型的表现。通过仅更新模型中低秩矩阵的参数,显著减少了训练所需的计算资源。通过实现变换不变性,进一步优化了微调过程,显著提升了模型性能。的应用,还为研究人员提供了宝贵的参考和研究方向。

2025-02-28 20:00:00 434

原创 DeepSeek-VL杀疯了!训练成本直降80%,4K高清图秒生成,设计师饭碗危险了?

通过Hollow Attention和Probe-Activated Dynamic FFN方法减少解码器-only架构中视觉Token的计算冗余,显著降低计算成本同时保持甚至提升模型性能,揭示了当前MLLMs中视觉Token处理的大量冗余,并为未来更高效的模型设计提供了重要启示。通过整合精细的面部编码模型和音频特征到现有的视频多模态大语言模型(MLLM)中,解决了当前模型在捕捉微妙面部表情和音频线索上的不足。同时构建了高质量的自审与人工审阅数据集,显著提升了情感识别与推理任务的性能。

2025-02-27 20:00:00 380

原创 卡尔曼滤波“开挂”!强化学习让目标跟踪精度暴增50%,吊打传统算法!

论文使用近端策略优化(PPO)算法在具有连续状态和动作空间的环境中训练DRL代理,并在不同数量的障碍物和不同程度的噪声下随机化环境,以捕捉真实传感器测量的效果。在PyBullet物理模拟器中进行了广泛的训练和测试后,无需进一步修改,即可将模拟中训练的策略直接部署到真实世界环境中,用于航点导航和避障。使用PPO算法在存在测量噪声的不同水平下训练DRL代理,比较了使用完美测量训练的代理与其他在不同水平测量噪声下训练的代理的性能。在评估过程中人为注入噪声,以改善在存在未知偏差的测量误差时DRL代理的性能。

2025-02-26 20:00:00 667

原创 蒸馏模型“天花板”被击穿!新方法让性能超越教师模型,登顶NeurIPS 2025!

实验结果表明,奖励模型蒸馏,特别是悲观奖励模型蒸馏,在偏好数据存在偏差的情况下,相比DPO和IPO框架,能够显著提高对偏好注释分布偏移的鲁棒性,同时保留了DPO方法的简单监督学习性质。发布的蒸馏模型通过输出层蒸馏和中间层蒸馏,将671B参数的“教授模型”压缩为多个轻量级学生模型,显著降低了硬件需求和推理成本。通过ScaLR方法,论文显著减少了蒸馏特征与全监督特征之间的质量差距,并提高了预训练骨干网络对领域差距和干扰的鲁棒性。通过扩展2D和3D骨干网络,并在多样化数据集上预训练,显著提高了特征质量。

2025-02-25 20:00:00 428

原创 AI圈炸锅!清华团队用神经网络+深度学习破解蛋白质折叠,Nature子刊狂赞!

该方法利用凸重述优化技术,在大规模数据集(如ImageNet)上展现出与主流深度学习优化器相当或更优的性能,同时减少了对超参数调整的依赖。也取得了显著成果,例如通过卷积神经网络(CNN)实现流场预测和湍流建模,为解决高复杂度、非线性问题提供了新思路。该方法为克服DNN频谱偏差提供了一种有前景的解决方案,可广泛应用于需要高频信息表示的任务。通过将高频率函数分解为低频率函数的组合来缓解深度神经网络(DNN)中的频谱偏差问题。提出了一种新的方法,通过将高频率函数分解为不同频率成分的组合来解决频谱偏差问题。

2025-02-24 20:00:00 258

原创 Nature新趋势!PINN+GNN强强联手,模型精度提升50%!

在四个基准数据集上进行实验,结果表明HSPGNN在结合不同阶数邻接节点时表现出色,能够自然地获得图样光流、动态图和缺失值影响,提供比传统数据驱动模型更好的动态分析和解释。该框架通过空间注意力机制动态构建拉普拉斯矩阵,并利用物理动态系统的偏微分方程来构建动态高阶时空GNN,以填补缺失的时间序列值。PIHGN为电力系统中的优化问题提供了一种新的解决方案,特别是在处理大规模复杂系统时展现出显著的潜力。利用机器学习技术,特别是图神经网络和物理信息神经网络,为解决复杂的电力系统优化问题提供了新的思路。

2025-02-21 20:00:00 344

原创 小样本学习的终极解决方案!贝叶斯创新如何打败90%的传统算法?

近年来成为人工智能领域的热点研究方向,其核心在于通过贝叶斯框架处理数据稀缺问题中的不确定性,从而提升模型的泛化能力。通过利用非欧几里得几何,镜像下降能够提供沿相应流形的最陡下降方向,从而加速收敛,并且对变分分布的参数化具有不变性。提出了一种基于高斯过程的贝叶斯模型集成框架,通过指定均值函数和核函数,将CLIP和其他预训练模型的知识进行整合。论文的核心在于如何有效地整合不同的预训练模型(如CLIP)以及其他预训练模型的知识,以提升小样本分类的性能。

2025-02-20 20:00:00 468

原创 PI-LSTM横空出世!时间序列预测准确率飙升66.57%,霸榜一区!

通过三个数值例子验证了E-PINN在非线性系统动态响应预测中的性能,结果表明E-PINN在训练效率和预测精度上优于传统PINN。在训练过程中,仅优化LSTM模块的权重和偏置,而SCL模块的权重直接从ETDM的离散卷积公式中提取。通过实验验证了该框架在闭环场景中的有效性,特别是在补偿远程操作UGV所经历的实际网络延迟方面。E-PINN通过解耦非线性系统的线性和非线性演化机制,显著提高了网络的学习效率和响应预测精度。通过在软地形上的UGV实验,验证了该框架在补偿网络延迟和提高命令跟踪性能方面的有效性。

2025-02-19 20:00:00 1320

原创 多模态RAG,ICLR 2025新突破!OmniSearch让检索效率提升80%!

是当前跨领域任务中的前沿研究方向,通过整合图像、文本、语音等多模态信息,弥补了单一模态的局限性。该研究解决了现有MRAG系统在信息获取与查询重构方面的局限性,并展示了显著提升的准确性和效率。利用生成模型和检索模块的协同作用,增强了对多模态信息的融合与处理效率。4.比较CLIP和RS在相似性评分上的表现,展示RS在区分相关和无关数据上的优势。通过动态检索规划框架,打破了传统多模态RAG的局限,显著提升了检索和生成的效率。引入了定量的相关性评分机制,增强了检索结果的质量和生成响应的准确性。

2025-02-18 20:00:00 423

原创 数据赋能医疗!小波变换联手多模态融合,性能提升11

通过分析公开数据集、选定的深度学习模型以及当前挑战和趋势,探讨了多源数据融合在提高变化检测任务中的作用。文章强调了光学、雷达、LiDAR和高光谱图像等多传感器数据的融合,以提供更详细和准确的地表信息。3.未来的研究应进一步探索新的多模态数据融合技术和深度学习模型,以应对更复杂的任务。3.探讨了多源数据融合的技术,包括光学、雷达、LiDAR和高光谱图像的融合。1.分析了公开可用的多模态遥感图像数据集,评估其在变化检测任务中的适用性。多模态融合遥感图像的深度学习方法显著提高了变化检测的精度和鲁棒性。

2025-02-17 20:00:00 580

原创 仅用10张图片,AI就能学会识别万物?多模态小样本学习颠覆传统!

该方法通过多模态蒸馏和掩码推理集成技术解决了第一人称视角视频中跨域少样本学习任务中的两个关键挑战:极端领域差距和实际应用中的计算成本问题。中的少样本问题,提出了一种面向任务的元学习框架,通过对比学习和层次解码器等技术,实现了对任务特定标签空间的有效个性化,并处理了分布外内容。2.面向任务的元学习框架有效减少了预训练模型与新型FVDER任务之间的领域差距,促进了更快更有效的微调。引入了新的数据集FewVEX,包含数千个实体级别的少样本VDER任务,促进了未来研究的发展。

2025-02-14 20:00:00 326

原创 RNN复兴!性能反超Transformer,训练速度提升1300倍!

Bengio团队提出的minLSTM和minGRU,通过去除隐藏状态的依赖和简化门控机制,显著减少了参数量和计算量。在T4 GPU上,对于长度为512的序列,minGRU和minLSTM的训练速度分别比传统GRU和LSTM快175倍和235倍。MOE框架结合了用于波动股票的RNN和用于稳定股票的线性模型,并通过门控网络动态调整每个模型的权重。2.设计了双幂次和幂指数校正动作,分别构建了具体的模型,并给出了相应的固定时间收敛性。系统方法,通过在预设误差动态中引入不确定性补偿,增强了系统的鲁棒性和收敛速度。

2025-02-13 20:00:00 907

原创 KAN杀疯了!小波变换结合,模型性能狂提50.41%,不卷也能发一区!

的论文在Nature、ICCV、AAAI等顶级期刊和会议上发表,进一步证明了这一组合在图像处理、时间序列预测等领域的广泛适用性。3.在MNIST和Fashion-MNIST数据集上的实验结果表明,FC-KAN的性能优于其他KAN模型。3.在MNIST和Fashion-MNIST数据集上进行了实验,比较了FC-KAN与其他模型的性能。2.在MNIST和Fashion-MNIST数据集上,FC-KAN的平均性能优于其他KAN模型。设计了FC-KAN架构,结合B样条、小波和径向基函数等数学函数。

2025-02-12 20:00:00 296

原创 发文新思路!双通道CNN的惊人突破,准确率接近100%!

该模型结合了卷积神经网络(CNN)和双向长短期记忆网络(B-LSTM),通过语法规则提取文本的局部特征,并利用Bi-LSTM提取包含上下文信息的全局特征。此外,通过词性注意力机制挖掘隐含的情感特征,解决了隐含文本分类效果差的问题。2.设计了混合MLP-DC-CNN分类器,其中 MLP 利用手动提取的特征,DC-CNN 利用基于强度的特征和深度解析的组织意减系数。结合了Transformer和CNN的优势,通过双分支编码器和双重注意力机制,有效解决了超声图像分割中的低对比度、高噪声等问题。

2025-02-11 20:00:00 498

原创 深度强化学习炸场顶会!10种黑科技思路,直接拿捏毕业论文!

在Re=100的三维圆柱上进行测试,该DRL方法通过学习高级控制策略,实现了9.32%的阻力降低和78.4%的升力振荡减少。作为人工智能领域的前沿技术,结合了深度学习的强大表征能力和强化学习的试错学习机制,使智能体能够在复杂环境中自主学习和决策。研究提出了一种新的算法,能够在考虑训练成本的情况下动态选择何时训练DRL代理,从而在实际条件下接近理想的学习代理性能。深度强化学习(DRL)框架在Re=100的三维圆柱上实现了9.32%的阻力降低和78.4%的升力振荡减少。

2025-02-10 20:00:00 364

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除