
论文阅读
文章平均质量分 96
ghost_him
依然在c++的道路上摸爬滚打。。。
展开
-
论文阅读:LDA-AQU:Adaptive Query-guided Upsampling via Local Deformable Attention
提出了一种上采样的模块,有着较好的效果。原创 2025-01-07 15:57:10 · 1318 阅读 · 0 评论 -
论文阅读:Forecasting Citywide Crowd Transition Process via Convolutional Recurrent Neural Networks
作者认为大多数先前关于城市人群建模的研究未能描述人类移动性的动态性和连续性,导致在处理多个同质预测任务时结果不一致且不相关,因为这些任务只能独立建模。改进:提出从新的角度对人类移动性进行建模,即使用由一系列从低阶到高阶的转移矩阵构成的全市人群转移过程,帮助我们理解人群动态如何逐步演变。细节:提出了一个深度转移过程网络来处理和预测这种新的高维数据,其中设计了新颖的网格嵌入与图卷积网络、参数共享卷积LSTM和高维注意力机制,以学习空间、时间和序数特征方面的复杂依赖关系。原创 2024-11-25 15:07:49 · 626 阅读 · 0 评论 -
xLSTM模型学习笔记
首先,LSTM 被设计为解决 RNN 中的梯度消失和爆炸问题,通过门控机制实现时序上的注意力控制。然后,sLSTM 通过改进激活函数和引入额外状态来增强模型的记忆和选择能力。接着,mLSTM 通过矩阵化记忆单元和引入键值对机制提升了长序列处理效率和并行能力。最后,xLSTM 结合sLSTM和mLSTM的优势,通过非线性变换和高维空间映射提高模型表现,并在大模型设计中提供更高的效率和适应性。原创 2024-09-11 10:03:30 · 1683 阅读 · 0 评论 -
Mamba模型学习笔记
Transformer的自注意力机制在处理长序列时计算复杂度高。时序状态空间模型(SSM)通过空间化建模实现并行计算。Mamba作为SSM的改进版,引入选择性机制,放松了线性和时不变假设,能高效处理超长序列。Mamba将SSM的固定参数改为可变,使用LSTM式门控,构建非线性时变系统。它采用液体运动模型和李指数映射,更好地描述记忆系统的连续性和关联性。相比Transformer的粒子运动模型,Mamba在长序列处理上更高效。原创 2024-09-09 10:47:22 · 1265 阅读 · 0 评论 -
论文阅读:A Spatiotemporal Multiscale Deep Learning Model for Subseasonal Prediction of Arctic Sea Ice
基于物理的动力学模型可以成功的预测短期海冰趋势,但是在较短时间内提供可靠的次季节海冰预测方面存在困难,并且缺乏足够的灵活性来提供实时、准实时预测。作者提出了一个纯粹基于数据驱动的北极海冰预测系统,叫 IceFormer。它通过高质量的北极再分析数据和遥感观测数据进行训练。通过实验可以证明:在北极海冰的级多变量预测方面取得了进展。在遥感数据的驱动下,其预测性能远优于传统基线模型和机器学习模型。原创 2024-09-08 18:47:33 · 1560 阅读 · 0 评论 -
论文阅读:A Data-Driven Deep Learning Model for Weekly Sea Ice Concentration Prediction of the 。。。
作者提出了一个名叫 SICNet 的网络,采用编码器-解码器框架,结合全卷积网络(FCNs),可以以高精度预测未来一周的 SIC。同时,设计了一个时空注意力模块(TSAM)以帮助 SICNet 从 SIC 序列中捕捉时空依赖性。模型的预测方法为递归预测,同时采用二进制准确性(BACC)指标来衡量预测的海冰范围(SIE)的准确性。现有的模型中很不有用于泛北极每日 SIC 的像素级预测模型。预测的准确性可以进一步提高纯粹的卫星衍生 SIC 能否支持泛北极每日 SIC 的每周预测。原创 2024-09-05 14:59:51 · 1105 阅读 · 3 评论 -
论文阅读:MambaVision: A Hybrid Mamba-Transformer Vision Backbone
作者提出了一种新型的混合 Mamba-Transformer 主干网络。通过重新设计 Mamba 公式,增强了其高效建模视觉特征的能力。此外,作者还通过对 ViT 与 Mamba 消融研究,实验结果表明了:在最后几层为 Mamba 架构配备几个自注意力模块,可以极大地提高捕获长程空间依赖关系的建模能力。最后,作者根据他们的发现,设计了一系列具有层次结构的 MambaVision 模型,最终取得了最佳的性能。原创 2024-09-03 09:16:31 · 1629 阅读 · 1 评论 -
论文阅读:VideoMamba: State Space Model for Efficient Video Understanding
为了解决视频理解中的局部冗余与全局依赖性的双重挑战。作者将 Mamba 模型应用于视频领域。所提出的 VideoMamba 克服了现有的3D卷积神经网络与视频 Transformer 的局限性。在视觉领域有可扩展性,无需大规模数据集来预训练。对于短期动作也有敏感性,即使是细微的动作差异也可以识别到在长期视频理解方面有优越性,相比基于特征的模式,有显著的进步。与其他的模态有兼容性,在多模态环境中表现出色。原创 2024-08-30 11:30:44 · 1039 阅读 · 1 评论 -
论文阅读:SimVP: Simpler yet Better Video Prediction
作者认为,现有的CNN,RNN,Transformer 之类的视频预测领域的模型都过于复杂了,作者想要找到一个简单的方式,同时可以达到与之相当的效果。作者提出了 SimVP,这是一个简单的视频预测模型,完全基于 CNN 构建,通过均方误差(MSE)损失函数以端到端的方式进行训练。在不引入任何额外技巧与复杂策略的情况下,就可以实现最先进的性能。原创 2024-08-28 15:08:53 · 2245 阅读 · 0 评论