
论文阅读
文章平均质量分 84
@Mr_LiuYang
AI从业者
展开
-
Foundation Models for Generalist Geospatial Artificial Intelligence论文阅读
本文提出Prithvi——首个专为地球观测设计的地理空间基础模型(GFM),通过自监督学习在超1TB NASA HLS多光谱卫星影像上预训练,并针对云隙填补、洪水制图、野火痕迹分割、多时相作物分类等任务进行高效微调。原创 2025-06-03 19:37:51 · 649 阅读 · 0 评论 -
铁路语义分割数据下载RailSem19: A Dataset for Semantic Rail Scene Understanding
RailSem19 是一个为铁路、道路场景理解提供丰富语义信息的数据集。它包含了 8500 张 由铁路车辆(包括火车和有轨电车)以自视角拍摄的图像,这些图像展示了在铁路和道路交汇区域的各种场景,包括铁路道口、城市街道上行驶的电车等。原创 2025-04-01 14:43:38 · 561 阅读 · 3 评论 -
Rethinking BiSeNet For Real-time Semantic Segmentation细节损失函数学习
本博客为文章“Rethinking BiSeNet For Real-time Semantic Segmentation”损失函数学习和使用。细节图像中,细节像素的数量远少于非细节像素,细节预测是一个类别不平衡问题。因为加权交叉熵总是导致粗糙的结果,文章采用二元交叉熵和Dice损失来联合优化细节学习。原创 2025-03-19 18:54:14 · 946 阅读 · 0 评论 -
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformer *模型解析及滑坡语义分割实战
SegFormer 是一种基于 Transformer 的语义分割模型,通过结合 多尺度特征融合 和 轻量级解码器,在保持高效性的同时实现了高精度分割。其核心思想是利用 Transformer 提取全局上下文信息,并通过多级特征融合提升细节恢复能力。原创 2025-03-02 18:45:00 · 1115 阅读 · 0 评论 -
Lite-HRNet: A Lightweight High-Resolution Network原理解析及代码分享
论文《Lite-HRNet: A Lightweight High-Resolution Network》原理解析及代码复现。Lite-HRNet是针对实时语义分割任务优化的轻量级网络,其核心思想是在高分辨率特征保持与计算效率之间取得平衡。相比原版HRNet,通过引入多分辨率特征交互机制与通道重参数化技术。论文提出者用于人体姿态估计,本文将其用于语义分割训练,损失无法下降,基本全无法提取,本文仅作为结构学习记录原创 2025-03-01 17:35:27 · 1166 阅读 · 0 评论 -
深度学习pytorch之22种损失函数数学公式和代码定义
本篇博客探讨了PyTorch中的 22 种常用损失函数,涵盖了从传统的回归问题到复杂的分类任务等多种应用场景。每个损失函数都附带了详细的数学公式和代码实现,帮助读者更好地理解损失函数的工作原理。原创 2025-02-20 11:01:44 · 836 阅读 · 0 评论 -
深度学习pytorch之19种优化算法(optimizer)解析
本博客详细介绍了多种常见的深度学习优化算法,包括经典的LBFGS 、Rprop 、Adagrad、RMSprop 、Adadelta 、ASGD 、Adamax、Adam、AdamW、NAdam、RAdam以及SparseAdam等,通过对这些算法的公式和参数说明进行详细解析,博客旨在为机器学习工程师和研究人员提供清晰的理论指导,帮助读者选择合适的优化算法提升模型训练效率。原创 2025-02-19 20:57:31 · 1850 阅读 · 0 评论 -
即插即用的注意力机制21种
随着深度学习特别是自然语言处理领域的飞速发展,注意力机制(Attention Mechanism)已成为提升模型表现的关键技术,本文主要记录了即插即用的注意力机制结构的功能、出处及核心代码。原创 2025-02-14 10:14:18 · 1332 阅读 · 0 评论 -
语义边缘精化方法_PointRend: Image Segmentation as Rendering
代码链接:https://github.com/zsef123/PointRend-PyTorch文章链接:https://arxiv.org/pdf/1912.08193.pdf参考阅读:https://www.cnblogs.com/Trevo/p/12172615.html一、核心思想语义分割在最后上采样的时候,一般存在一个直接的多倍上采样,以如下PSPNET为例,最后预测时...原创 2020-05-07 15:32:49 · 2708 阅读 · 0 评论 -
Mask_RCNN体系面向对象语义分割进化史及代码实现
一、F_rcnn网络简介网络主要包括两个部分:1、特征提取网络():它用来从大量的图片中提取出一些不同目标的重要特征,通常由conv+relu+pool层构成,常用一些预训练好的网络(VGG、Inception、Resnet等),这里采用连续的13个卷积层、relu激活函数组合,间杂着4个池化层,获得的结果叫做特征图。2、目标检测网络(Region Proposal Ne...原创 2020-05-01 21:09:59 · 783 阅读 · 0 评论 -
ACFNet:用于语义分割的注意类特征网络
原名:ACFNet: Attentional Class Feature Network for Semantic Segmentation链接:Accepted to ICCV 2019,https://arxiv.org/abs/1909.09408参考阅读:https://blog.youkuaiyun.com/gefeng1209/article/details/102760719一、方法...原创 2020-04-26 20:37:49 · 2151 阅读 · 0 评论 -
RGPNET: 复杂环境下实时通用语义分割网络
原文及链接:RGPNET: A REAL-TIME GENERAL PURPOSE SEMANTIC SEGMENTATIONhttps://arxiv.org/abs/1912.01394一、方法简介RGPNet由轻型非对称编码器-解码器和适配器组成。适配器有助于从编码器和解码器之间的多层分布式表示中保留和完善抽象概念。它还有助于从较深层到较浅层的梯度流动。二、创新点及小技...原创 2020-04-26 11:01:38 · 483 阅读 · 0 评论 -
FarSee-Net:通过高效的多尺度 上下文聚合和特征空间超分辨率进行实时语义分割
原名字:FarSee-Net: Real-Time Semantic Segmentation by Efficient Multi-scale Context Aggregation and Feature Space Super-resolution下载地址:https://128.84.21.199/pdf/2003.03913.pdf一、技术路线语义分割模型区分为前端网络提...原创 2020-04-25 22:34:05 · 2035 阅读 · 0 评论 -
用于从航空和卫星图像中自动提取建筑物的规模鲁棒卷积神经网络
原名:A scale robust convolutional neural network for automatic building extraction from aerial and satellite imagery下载地址:https://www.tandfonline.com/doi/pdf/10.1080/01431161.2018.1528024?needAccess=tr...原创 2020-04-25 11:19:24 · 1005 阅读 · 2 评论 -
使用卷积神经网络和模拟样本从大规模航空影像中进行建筑实例变化检测
一、技术路线图使用Mask R-CNN和MS-FCN进行建筑物提取,再以提取的结果作为地面建筑物输入unet进行变检。二、创新点及小技巧1、创新(1)MS-FCN模型将unet模型各层结果都上采样到最后输出同等大小而后进行卷积操作获得最后的输出。2、小技巧(1)预测时采用切割大图成小块,预测后50%区域边缘移除,后缝成无缝的大图像以进行评估。该策略有效地避免了特...原创 2020-04-25 09:36:48 · 1008 阅读 · 3 评论