- 博客(713)
- 收藏
- 关注
原创 频频登顶Nature子刊,UNet实在太好用!
UNet自被提出以来,已经被引用超过5万次,至今仍然是各大顶会顶刊的常用baseline,关于它的改进自然也是相当火热,近些年更是频频登上Nature子刊。简单看了一些成果,可以说是五花八门,主要围绕等几个方向展开。不过除了医疗这个核心场景,UNet在工业与新兴领域也有了不少拓展,对于论文er来说,等于又有了新的创新空间,建议感兴趣的同学抓紧搞起。如果需要参考,我这边也整理了,包含了上述的几个细分方向,基本都有代码,无偿分享~全部论文+开源代码需要的同学看文末。
2025-04-03 16:20:34
638
原创 Mamba杀入遥感图像!11个全开源idea,助你无痛发顶刊!
一方面,Mamba相关的研究不算太卷;另一方面,Mamba强大的全局建模能力和高效的计算效率,完美切合遥感图像领域计算效率、长距离建模、多时相分析等方面的需求。因此,在众多对实时性要求高的场景(比如城市规划、国防安全等)中,Mamba+遥感图像的优势巨大,它的落地前景自然广阔。相对的,关于它的研究成果也逐渐增多,不少高质量新成果陆续发表,比如顶刊TGRS上的ChangeMamba。如果大家感兴趣,趁这方向还处于低饱和状态,抓紧上车。创新建议紧扣遥感数据特性(比如多模态、多尺度),重点在上突破。
2025-04-02 17:16:20
622
原创 (CVPR 2025)卷积网络复活!港大最新改进版CNN涨点起飞!
有人说现在研究CNN已经没啥意义了?不如先看看今年CVPR'25上超多的CNN成果。这其中,港大最近重磅推出了新型纯CNN架构OverLoCK,性能连超传统CNN、Transformer与Mamba!实力证明而且,CNN在图像、视频等领域仍然是主流,我们在轻量化和结构创新上的改进也在持续推进CNN的效率与性能,现在的CNN在一些新兴的应用场景(比如元宇宙)中也有了进一步拓展,因此,对CNN感兴趣或有需求的同学不要犹豫,抓紧时间搞创新。目前围绕CNN的创新主要有(比如LSTM),其中结合小波变换相当火。
2025-04-01 17:31:11
990
原创 Transformer+UNet到底是谁想出来的点子!用来创新真的太绝了!
其实不仅仅是这领域,这种技术在需要处理大尺度图像、长程依赖、多模态数据的任务中都很关键,源于其结合了UNet的多尺度特征提取能力和Transformer的全局建模能力,因此应用场景相当广泛。对应的,近年关于Transformer+UNet的研究越来越火热,论文数量持续增长(如CSWin-UNet、GS-TransUNet、TSUBF-Net等),可参考的优秀成果相当多。不过目前这方向在计算效率、多模态融合、轻量化设计、特定场景下的优化等方面依然还有改进空间,值得我们深入挖掘。
2025-03-31 17:28:53
907
原创 “具身智能”顶会大爆发!李飞飞新作获最佳论文,这思路我吹爆!
今年是越来越火了,李飞飞团队的成果一个接一个,上回还是荣获CoRL-LEAP研讨会最佳论文奖的ReKep,这个月月初又发布了𝗕𝗥𝗦,一个解决机器人在家庭任务中全身操作问题的综合框架,500美元就能让机器人帮你干一切家务!另外还有许多成果成功登上各大顶会,足见具身智能!加上之前看过的麦肯锡预测,到了2030年,全球具身智能市场规模可能达到数十万亿元,!入局不亏。那么问题来了,未来我们该向何处发力?鉴于具身智能泛化性等核心问题尚未解决,建议考虑跨学科融合、底层技术革新等方向。我还整理了,又打包了。
2025-03-28 11:11:35
348
原创 Mamba杀入图像增强!26%算力碾压SOTA!字节、华为都在做...
当前视觉领域对高效长序列建模需求激增,对这方向的研究自然也逐渐火热。原因在于其高效长程建模,以及动态计算优势,在图像质量提升和细节恢复方面有难以替代的作用。因此短时间内,就有不少Mamba+图像增强的成果陆续发表,比较突出的有字节等团队提出的图像恢复网络VmambaIR,仅使用26%的计算成本就实现了超越SOTA的重建精度,还有华为诺亚方舟实验室等提出的基于Mamba的图像增强方法TAMambaIR,计算效率起飞。其他还有不少值得参考的,我挑选了分享给大家,基本都有代码,搞科研还是离不开巨人的肩膀的。
2025-03-26 17:22:00
781
原创 左手CVPR,右手顶刊!医学图像异常检测“登峰造极”进行时,冲就对了!
当下医学影像数据激增,我们对AI辅助检测的需求更加迫切(意味着工业价值高),再加上现在的技术仍然存在缺陷(意味着迭代空间大):数据标注成本高、异构性大等。可见无论是在学术界还是工业界,医学图像异常检测都备受关注。目前,这方向还是围绕等角度深入,另外还出现一些新兴的创新角度,比如4D时空建模、非监督域适应等,大家有兴趣可以研究研究。值得一提的是,这方向比较注重"临床价值-技术创新-落地可行性"平衡,建议从具体临床场景切入。如果需要参考,可直接看我整理的,包括顶会顶刊,基本都有代码。
2025-03-25 17:21:05
316
原创 审稿人最爱的技术融合!YOLO+SAM双剑合璧!速度与精度All in
众所周知,一些领域对速度与精度的要求都很高,比如自动驾驶、机器人交互、医疗影像...为了满足这些需求,推动场景的落地应用,针对的研究逐渐火热,成为了当前CV领域的热门研究方向。原理在于,YOLO以实时性为核心优势,但分割精度不足;SAM通用分割能力强,但推理速度慢。这两者结合,既能提供快速目标检测框,又可以基于检测结果精细化分割,完美实现!为动态场景下的高效精细感知提供了新思路。
2025-03-21 17:20:54
659
原创 顶会新宠!剑桥凭“机器学习+因果推断”杀疯ICLR!2025发论文的黄金赛道来了!
看了这几年各大顶会的投稿趋势,发现相关的论文增长迅猛,研究热情高涨。比如ICLR 2025上剑桥大学提出的Celcomen模型,首次实现空间转录组学因果推断可识别性。不仅如此,机器学习+因果推断在工业界的需求同样旺盛,微软、Uber等企业纷纷入场,医疗、金融、自动驾驶等领域还存在大量未解决的因果建模问题,这些可都是丰富的应用场景和创新切入点。2025年,我们可以从。
2025-03-20 16:59:50
508
原创 多模态对比学习太香了!双斩CVPR/NeurIPS!新成果及开源代码已扒
它最近在各大顶会上(尤其是CVPR)可是相当受欢迎,比如NeurIPS上的CILPLoss模块,性能达到新SOTA;还有CVPR上的BadCLIP方法、HACL方法...多模态对比学习的优势在于它,尤其在多模态表征学习、跨模态对齐、预训练模型等领域表现相当好,研究潜力巨大。这方向的创新路径也很广泛,包括动态融合、处理缺失模态、引入因果推理等。不过根据当下的研究进展,建议大家还是从等多角度切入做创新。如果需要参考,可直接领取我整理的全部论文+开源代码需要的同学看文末。
2025-03-19 17:42:37
921
原创 入选CVPR 2025!何恺明联手LeCun改进Transformer!新思路学到就赚到~
何恺明大佬这几天又整了个大的,和LeCun联手提出了一种没有归一化层的Transformer,性能比传统Transformer更强!而且他们甚至只用了9行代码...大家感兴趣可以复现了试试。这波属实是Transformer的大突破!目前也已拿下CVPR 2025。加上前不久清华微软的爆火成果Diff Transformer,近期关于又迎来了新热潮!大家没idea的快冲!改进Transformer方法思路很多的,关键在于结合具体问题提出创新。比如针对计算复杂度问题,研究线性注意力或混合架构;
2025-03-18 17:49:07
459
原创 荣登Nature招牌1区Top!可解释的多模态融合模型迎来新突破!
现有关于多模态融合的研究多集中在模型性能的提升上,对可解释的探索比较少。但实际上,可解释性是提升用户信任、优化模型决策的关键,具有重要的研究价值,符合当前学术界对透明AI的迫切需求。因此,想要在多模态领域拥有成果,是个很好的选择。中山六院团队的可解释多模态融合模型Brim,以及Nature子刊上的可解释纵向多模态融合模型,都是近期非常值得参考的研究,推荐感兴趣的论文er研读。我另外还准备了,方便找idea的同学做参考。实在没思路的话,推荐考虑细分领域(如医疗)的实际需求,从(如动态注意力)、
2025-03-17 18:07:40
653
原创 连看几十篇YOLO论文,发现了YOLO中稿的“潜规则”!这妥妥发SCI的捷径!
看了前几天刚发表的YOLOv12,深感YOLO研究之热,这迭代速度也太快了...不过往好处想,也说明YOLO相关的研究需求非常旺盛,属于SCI常客,再加上YOLO在自动驾驶、机器人导航等领域的广泛应用,用它发论文还是比较容易的。关于,现在比较流行的有(如引入Mamba)、(如CIoU)、(如YOLOv10的NMS-Free设计)。针对现有的工业需求和未来发展趋势,我们也可以从等实际问题角度进行探索。如果大家想发论文,建议先从上述主流(如新模块设计)入手,参考多资源也多,入门轻松。我这边整理了。
2025-03-14 17:56:47
793
原创 李飞飞&DeepSeek都在用!模型蒸馏爆火!在CVPR上杀疯了...
被李飞飞成本不到150元的推理模型s1震撼到了,甚至他们只花了26分钟...研读后发现秘诀只有一个:蒸馏。简单来说,就是将谷歌Gemini 2.0的推理能力蒸馏到阿里Qwen2.5模型中,得到s1,效果媲美DeepSeek-R1和OpenAI o1。不得不赞叹的强大,这种将大模型知识迁移到小模型上的技术,在降低训练和部署成本方面遥遥领先。这也是它成为s1秘诀和DeepSeek核心技术的原因,非常贴合当下“技术普惠”的发展趋势,研究前景明确。当前,模型蒸馏仍然是,但成熟度比较高。
2025-03-14 17:54:52
474
原创 拿下CV顶会!多模态特征融合+Mamba新方法,性能超越SOTA!
Mamba,一种具有强大信息整合能力的技术,加上多模态特征融合,不仅能提升模型在处理复杂任务时的准确性和鲁棒性,还拓宽了应用边界:从智能交互到复杂数据分析的多个领域...都涵盖了。创新空间和落地应用前景可见一斑。去年至今,相关的论文呈爆发式增长,其中顶会顶刊成果占比可观,比如ICASSP 2025的DepMamba模型,计算效率、准确率等都优于SOTA。如果有同学也对此感兴趣,想出成果,推荐优先探索,结合真实场景需求设计创新点。为方便大家找参考,我已经整理好了。
2025-03-12 17:44:57
1069
原创 创新耐打!时间序列+聚类这么做,顶会稳了!
它同时也是数据挖掘与模式识别的核心课题,能高效挖掘数据模式,提高预测和分析的准确性,非常适合多变的数据环境,比如金融、医疗、零售、制造业等领域。这方向近年来在工业界的需求增长不断,研究前景广阔。当前顶会上相关论文成果多聚焦于跨领域模型构建与实际场景适配,比如华东师大的DUET。如果想发论文,建议从切入,结合最新技术(如扩散模型)搞创新。本文整理了,开源代码已附,包含最近的顶会顶刊成果,供各位做参考,没思路或有其他问题也欢迎交流~全部论文+开源代码需要的同学看文末。
2025-03-11 17:43:18
632
原创 深度学习+多模态数据融合,顶刊超神了!
还在搞传统的?不如考虑。优势在于能融合不同模态的特征信息,实现模型理解、预测和决策能力的大幅提升,可以帮助我们开发出拥有更高性能的智能算法和模型,近期的不少一区顶刊上陆续发表了相关研究,热度可见。不过深度学习+多模态数据融合仍然处于快速发展期,数据异构性、模态缺失等问题尚未解决,还是有创新空间的,尤其在解决实际挑战或提出新型融合架构方面。在未来更复杂场景下,显然这类多模态融合技术将成为核心支撑,且技术迭代必然很快,如果大家感兴趣就得抓紧了,找idea可以直接看我整理的,速度上车。
2025-03-07 17:21:02
780
原创 融合LSTM与Transformer做时间序列预测,发高分轻轻松松!
不仅巧妙融合了二者的优势,还构建了一个强大而灵活的预测框架,为我们处理复杂时间序列数据提供了更牛x的工具。这方向如今是深度学习领域的热门研究主题,前景非常可观,在工业物联网(如设备故障预警)、智慧城市(如交通流量预测)、生物医学、环境科学(如气象预测)等领域都有广泛应用。相关成果频繁发表于顶会顶刊,尤其是跨学科相关的。如果想做创新,建议聚焦,并结合实际工业需求设计实验(如大时滞、多变量场景)。本文整理了,需要参考的自取~全部论文+开源代码需要的同学看文末。
2025-03-06 18:29:48
1245
原创 喜提CVPR 2025满分!数据蒸馏取得新突破!速度up20倍,GPU占用仅2G
敢信一块2080Ti就能做大模型?上交大提出的全新数据集蒸馏方法NFCM做到了,不仅速度提升了20倍,GPU占用更是只有2G!相关论文获得了CVPR 2025满分!作为DeepSeek的核心技术,数据蒸馏因为能通过压缩数据集或知识迁移,,成为了资源受限场景(比如移动设备)必备技术。又因为其涉及子领域众多(比如分布匹配),还与生成模型等技术交叉,从而拥有了相当。可谓产业与学术的双重落地,无疑是机器学习领域的研究焦点。
2025-03-05 17:17:37
1144
原创 Kimi“撞车”DeepSeek!新一代注意力机制的极限突破!
近期,各方大佬在注意力机制上又“打起来了”。首先登场的是顶流DeepSeek,新论文梁文锋署名,提出了一种新的注意力机制NSA。同天,Kimi杨植麟署名的新注意力架构MoBA开源。紧接着,华为诺亚提出高效选择注意力架构ESA。这神仙打架的场面太震撼(论文解析在下文),同时也证明注意力机制依然是2025最受追捧的研究热点之一,仍处于快速发展期,深度学习搞创新少不了。
2025-03-04 17:02:39
982
原创 特征融合这样创新!与GNN结合顶天,一区TOP刊如囊中物!
在处理具有复杂关系结构的数据时,为增强模型的表示能力和预测性能,我们考虑。优势在于能整合多种特征信息,并通过GNN捕捉节点间的复杂关系,尤其适合医疗数据分析、情感识别等应用场景。这结合也是双热点叠Buff,加上数据驱动优势(适用于非欧数据,覆盖场景广,有实验对比优势),关注度自然水涨船高,顶会顶刊成果已然不少。比如一区TOP刊IEEE TC上的基于GNN的时频双流网络,表现超越了SOTA。为方便感兴趣的同学找创新点,本文整理了。
2025-03-03 17:52:19
844
原创 狂发顶会的Mamba,融合傅里叶变换再出神作!
核心优势在于通过增强频率相关性建模和优化计算过程,可以显著提升信号和图像处理的效果与效率,应用场景已扩展到了医学影像分析、视频时序建模等各种任务。这方向近期的研究趋势逐渐火爆,新成果有图像去雨框架Fouriermamba,去雨性能超越SOTA;还有新型3D医学图像分割框架EM-Net,参数量比SOTA少一半,训练速度快了2倍...这些成果主要是围绕。如果大家想入手,除了上面热门的角度,还推荐往等细分方向考虑,趁着还不太卷抓紧上车。我这边整理了,需要参考的同学不用多花时间了,直接来拿~
2025-02-28 17:59:46
801
原创 结合CNN与Transformer,实现遥感图像处理性能巅峰,霸榜顶会顶刊!
还记得这个热门组合吗?最近发现它在领域有不少高质量成果。比如顶刊Nat. Commun.上的GlaViTU 模型,一区IEEE TGRS上的SparseFormer(用于稀疏点标注遥感语义分割)、 LGCNet 模型等。其实这也是遥感图像领域的发展趋势,这类混合架构通过轻量化设计(如Lite-Mono参数减少80%)和高效注意力机制(如LeWin模块),显著提升任务性能,完美契合工业界需求,研究前景很广阔(论文er可试)。
2025-02-27 20:04:19
1107
原创 物理信息强化学习爆火!登上IEEE Trans一区顶刊!
近日顶刊IEEE TSE(一区)上还发表了相关成果,提出了一种基于约束强化学习的PIRL方法,计算速度大幅提升。PIRL属于PIML与强化学习的交叉领域,结合了物理规律的严谨性与强化学习的灵活性,在数据稀缺领域(如航空航天)、动态复杂系统(如湍流控制)、工业自动化等场景表现相当突出。所以这方向无论,当下还有很多创新思路可搞,比如...没idea的同学可考虑。本文整理了物理信息强化学习,有代码的都贴上了,需要参考的可无偿获取。全部论文+开源代码需要的同学看文末。
2025-02-26 18:07:05
793
原创 多模态LLM+Mamba组合出击!推理加速约20倍!GPU显存减少75%!
发现一篇效果很好的论文,上周刚刚发表,论文提出了Multimodal Mamba多模态解码器模型,通过将Transformer模型的知识蒸馏到线性复杂度的Mamba架构中,实现了20.6倍的速度提升和75.8%的GPU内存节省。这效果在MLLM+Mamba一众成果中也算非常突出。近些年MLLM发展迅猛,再加上Mamba高效的分布式计算和强大的上下文理解能力,MLLM+Mamba这一结合已是当前极具潜力的研究方向,
2025-02-25 17:34:09
1018
原创 变种PINN,更小的误差,更高的性能!
刷到篇2025年西工大刚发的文章,讲的是PINN的新变种——VW-PINNs(PINN中PDE残差的体积加权方法),研究表明其具有更小的误差,更好的性能。如果对PINN比较熟悉,应该很好理解VW-PINNs(下文有解析)。近年来PINN相关的研究频繁发表于《Nature》等顶级期刊,加上其在交叉学科的应用需求,以及丰富的开源代码资源(多数改进方案都开源),PINN的变种研究已经成了的一个方向。当前,PINN改进比较热门的创新有算法优化、架构创新、应用拓展等,未来也可进一步聚焦。
2025-02-21 17:21:33
683
原创 KAN备受审稿人青睐!结合小波变换就能发一区,厉害了
自提出至今,一直备受顶会青睐,前不久KAN被ICLR25接收为Oral Paper,与之相关的研究越发火热,其中的思路尤盛。一方面,小波变换的多尺度分析能力可以为KAN提供更丰富的特征表示,从而提高模型的性能。另一方面,KAN的灵活性和表达能力可以让这组合在处理复杂数据集时表现出色。二者可谓相辅相成,在特征提取、故障诊断等方面发挥了重要作用,如今更是作为热门前沿方向,KAN+小波变换的多篇高质量的论文已经在多个顶会顶刊上发表,比如一区上的一篇成果,通过结合两者,在乳腺癌诊断各指标上都非常出色。
2025-02-20 18:01:53
707
原创 喜提Nature正刊!小样本机器学习突破性新方法来了!
前不久,Nature发表了一篇小样本机器学习论文,讲的是一个表格处理模型TabPFN,平均2.8s解读任意表格,开箱即用,在精度和速度上实现了突破性进展。有人说这是电子表格的ChatGPT时刻,倒也不夸张,本身对于解决数据稀缺问题就十分重要(),如今也正处于快速发展阶段(),关于它的研究,现在有了如此突破,后续发展态势必将更加火爆。目前,小样本机器学习尚有很多问题没解决,对于科研人来说,潜在创新方向或可考虑:模型架构优化、数据增强技术、跨领域迁移与泛化、绿色高效算法、安全与鲁棒性研究...
2025-02-19 17:21:43
1184
原创 “特征融合+小目标检测”新热点不可错过!中稿顶会顶刊就靠它!
它通过整合不同层次或尺度的特征信息,有效提升了小目标的检测精度。比如北理工的轻量级特征融合EFC,即插即用,实现小目标检测高效涨点!当前,这方向是,基本围绕等展开创新。鉴于其仍然存在的不足,未来可能会在长尾分布问题、跨尺度特征对齐、无监督/弱监督学习、硬件协同设计等角度有新的破局思路。今年刚开年,这方向就有不少新研究了,且开源代码丰富,很适合快速复现与改进。我这边挑选了,都很值得参考,想找灵感的同学可以看看。全部论文+开源代码需要的同学看文末。
2025-02-18 18:24:38
552
原创 正在爆发!“LSTM+卡尔曼滤波”成论文新赛道!
核心思想是结合两者各自优势(LSTM的时序建模能力+卡尔曼滤波的动态状态估计),以提高系统的性能和准确性,非常适用于多种时间序列预测和状态估计任务。这方向属于深度学习与传统滤波算法的交叉领域,目前处于技术上升期,在自动驾驶、无人机跟踪、传感器融合等领域都有很大需求,这边推荐从等入手做创新,未来也可考虑模型可解释、训练数据需求、参数耦合问题...如果需要参考,可以看我整理的全部论文+开源代码需要的同学看文末。
2025-02-17 18:35:43
1030
原创 端到端聚类成顶刊新宠!新作训练速度超Transformer百倍
一区二区都有不少新成果,比如IJCV 2024的IDDC方法,性能优于所有现有无监督语义分割方法,还有LoSTer算法,训练速度比Transformer快数百倍!这方向,因为它能自动化完成从数据输入到聚类结果输出的整个过程,无需人工干预中间步骤,,在机器学习与数据挖掘领域,尤其是无监督学习和复杂数据建模中,拥有超级强大的潜力。如今,大模型的进步推动着端到端聚类在更多领域实现“从数据到知识”的无缝衔接,未来关于它的创新将集中在等方面。本文整理了。
2025-02-14 18:04:32
883
原创 强化学习+多目标优化,get到这种思路,发一区TOP就不远了!
有个核心优势,叫"动态决策能力",意思是通过智能体与环境的持续交互,能自主探索高价值区域。而之后,系统能同时权衡路径长度、时间成本、资源消耗等多个维度。因此,这种"双轮驱动"的研究范式在电力调度、物流规划等工业场景中潜力巨大,而在学术圈,因其突破了传统算法的性能瓶颈,又延展出了新的理论框架,也未来,此方向的创新可从等方向突破,如果大家感兴趣,可以看我整理的作参考,开源代码已附。全部论文+开源代码需要的同学看文末。
2025-02-13 18:08:53
911
原创 因果机器学习(CausalML)前沿创新思路
结合了传统因果推断与机器学习的是目前AI+领域的前沿研究方向,其核心优势在于将因果逻辑融入数据驱动模型,从根本上解决了传统方法的缺陷。因此,它也是突破传统机器学习瓶颈的关键方向,今年,我们关于因果机器学习的创新可围绕这些方面展开,比如结合深度学习与稀疏因果图,开发轻量化混杂控制方法...既有理论深度又有实际价值,故事编好发高区问题不大。当然,还是建议大家多关注顶会顶刊中相关的最新工作,结合一些具体领域(比如医疗)来展开。我这边整理好了,大家需要参考的可直接领取。全部论文+开源代码需要的同学看文末。
2025-02-12 18:01:39
1031
原创 CNN+Mamba+UNet,“三巨头” 合体!
一方面,这种组合融合了CNN的局部特征提取能力、Mamba的全局建模能力和UNet的结构特点,实现更全面的特征理解;另一方面,这一架构凭借高效建模能力与多模态适应性,已成为遥感、医学、视频分析等领域的创新标杆,相关研究在CVPR、AAAI等顶会中占比飙升,堪称发Paper的“黄金配方”!可见,各大顶会对这类融合模型接受度还是很高的,如果大家感兴趣,我建议就从模块设计或跨领域应用切入,结合开源代码快速验证。我这边整理好了可用作参考,代码也有,需要的同学速领。全部论文+开源代码需要的同学看文末。
2025-02-11 19:43:00
1587
原创 还在死磕传统PINN?自适应版本训练效率狂飙,审稿人直呼“这才是真创新“!
各位搞AI+物理研究的同学们注意啦,今天咱们来盘一盘这个被顶会顶刊审稿人偏爱的热门主题——(物理信息神经网络)。众所周知,传统PINN虽火,但它训练不稳定、计算成本高,导致很多人在顶会deadline前依然疯狂改代码...而自适应PINN直接从底层重构优化逻辑,引入动态权重分配和自适应采样策略,不仅,在流固耦合、非稳态传热这些地狱级场景照样OK!因此,与其在传统PINN里卷损失函数,不如考虑自适应PINN创新。
2025-02-10 20:16:20
1247
原创 DeepSeek-R1同款算法!强化学习2025发论文的核心思路
最近DeepSeek-R1系列犹如一记炸雷响彻整个AI圈,功能比肩ChatGPT-o1还是开源,用过之后大家纷纷宣布退订20刀乐(hh)。而DeepSeek-R1最关键的创新其实已经发布了,就是LLM算法GRPO(还有多阶段训练策略)。这个在RL领域的创新为学术界和工业界提供了重要的思路,尤其在等方面。同时,它也为未来RL的研究指明了方向——,啊对,还有开源(doge)。为方便刚入门RL的小白以及想要进一步创新的同学了解前沿,我整理了全部论文+开源代码需要的同学看文末。
2025-02-08 18:00:10
1011
原创 又一篇CCF-A!多尺度Mamba“ 杀疯了 ” ....
在各大顶会中,多尺度Mamba也是很受欢迎的选题。比如收录于医图顶会 MICCAI的基于多尺度融合的Mamba架构Deform-Mamba,实现了SOTA性能!还有NeurIPS 2024上的多尺度视觉MSVMamba,兼顾效率与性能,适配各种模型配置,具有极高适应性和可扩展性!另外还有超低参数量和内存,但性能依然优越的MUSE...可以说优秀成果相当多了,强烈建议想发论文的同学研读。本文整理了,方便有需求的同学快速了解这方向的前沿技术,找到灵感,代码已附。全部论文+开源代码需要的同学看文末。
2025-02-08 11:12:19
1382
原创 太全了!多模态深度学习的大热门idea!
未来AI发展的必然趋势是什么?必然是。它不仅是当前人工智能领域的热门研究方向之一,也是学术界和工业界共同关注的重点,值得长期投入。当然,这方向仍存在大量开放性问题,但对论文er来说也意味着更多的创新空间,推荐还没有idea的同学尝试。(比如最近爆火的DeepSeek-R1的多模态版Align-Anything)、为方便大家研究的进行,我这边整理好了,每个方向都有参考(附代码),不想多花时间找论文的同学可以直接拿~全部论文+开源代码需要的同学看文末。
2025-02-07 20:24:07
942
原创 Transformer结合特征融合依旧可以卷!来跟着斯坦福学习怎么创新!
Transformer现在还能怎么做创新?不妨考虑结合特征融合。这种思路意在利用Transformer的自注意力机制和特征融合技术的优势,以提高模型的性能、降低计算成本以及增强模型的泛化能力。比如斯坦福最近的新作Fusion-Vital,一种新颖的视频-射频(RGB-RF)融合Transformer,采用了Transformer-based fusion strategies和cross-attention机制来对齐和融合多模态特征,有效地捕捉微观生理标志,预测误差降低了83.4%。
2025-02-07 13:57:24
752
原创 SHAP可解释性竟然还能做聚类分析?11个结合idea带你一网打尽顶会顶刊!
这种结合不仅能深入理解模型的决策过程,还能通过聚类揭示数据中的潜在模式,进一步提升模型的可解释性和性能,在医疗、金融风控、电子商务等领域应用超级广泛,是个研究价值高、创新空间大的方向,非常适合我们做创新。目前,这方向主要围绕基于SHAP值的监督聚类、聚类辅助的SHAP解释增强、交互式特征分析与模式发现等核心思路进行研究,如果大家想发论文,也建议从这些角度入手。感兴趣的同学可以看我整理的,开源的代码都附上了,有问题欢迎评论区交流~全部论文+开源代码需要的同学看文末。
2025-02-06 19:36:31
667
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人