- 博客(18)
- 收藏
- 关注
原创 Mark一下CoT原文
3.用途广泛&可以通过few-shot prompting模板training-free地注入。1.拆解多步问题,用额外的compute提升表现。
2024-09-26 16:12:43
240
原创 轨迹数据是一种特殊的时间序列
目前的做法是过拟合每一条轨迹,然后基于这条轨迹的起始点autoregressive预测后续点,实现数据增强。把每个轨迹点当做一个token,同样是(B,N,C)处理。学习序列模型LSTM、Transformer自回归。Encoder-Decoder结构get。
2024-06-11 03:30:30
236
原创 Diffuser: Potential NSFW content was detected in one or more images.
使用controlnet的过程中碰到以下问题,直接得到黑色图像。
2024-02-28 11:38:20
2091
4
原创 如何将PyTorch Lightning的.ckpt文件转化为.pth文件
使用pytorch lightning框架下训练好的一个分割模型,需要在另外一套使用原生pytorch写的代码中,不知道怎么加载训练好的.ckpt模型。ckpt里保存了更多信息,而我们只需要state_dict,同时观察到两者的参数命名存在略微差异。
2024-02-28 11:27:14
1571
1
原创 【AI论文作图】如何表示模型参数冻结状态?
但我还是觉得Microsoft的这个图标更好看,一直在网上找解决方案,后面突然想到,可以找到emoji对应的png,直接贴进来即可。
2024-01-22 17:24:06
3846
原创 ManualKDE: 交互式选点 x 核密度估计 x 热力图可视化 x 参数可调
输出结果存储在当面目录下的results文件夹(自动生成),命名为原始图片文件名+'_heat.png'不用多次运行代码,需要用多少次就用多少次:“动一下鼠标(选图片) 几下鼠标 (标热力点) 继续动一下鼠标(选图片)”
2024-01-02 17:13:35
567
原创 仓库友好&性能SOTA的遥感影像语义分割
遥感数据集&方法眼花缭乱,本文总结常见的数据集、开源方法、当前SOTA,帮助领域外用户高效完成遥感语义分割任务
2023-10-16 17:06:14
351
2
原创 学习遥感大模型(2)---SAM的两种用法(2)
CLIP Surgery是一种专门针对CLIP模型的解释方法。通过使用文本提示,CLIP Surgery 可以生成准确突出显示相应区域的解释图。Grounding DINO将 DINO 与开放集目标检测结合起来,Grounding DINO可以根据文字描述检测指定目标。代码:https://github.com/Douglas2Code/Text2Seg。机构:University of Georgia Athens, Georgia;用现有的、通用的、比较好的视觉基础模型,生成。更好理解图像语义特征。
2023-10-09 17:33:19
482
1
原创 学习遥感大模型(2)---SAM的两种用法(1)
北航、上海人工智能实验室0.简介这篇工作尝试将Meta的SAM迁移到遥感实例分割任务上,需要在遥感数据集上微调;相比SAM交互式的分割(基于不同的Prompt),这篇工作提出自动生成prompt,但是学习到如何自动生成prompt的过程似乎依赖训练数据集,也就是说:模型能识别的类别局限于所有的训练类别。1.动机:需要prompt,prompt类型、位置和数量影响SAM效果SAM缺乏语义信息2.现有的将SAM应用于实例分割的思路3.本文的思路•基于遥感数据集训练一个“
2023-10-09 17:18:13
1090
1
原创 CLIP:为什么加一个文本前缀it is a photo of,模型表现会更好?
为什么加一个文本前缀it is a photo of, CLIP模型表现会更好,是因为这是一种
2023-09-08 11:35:29
366
1
原创 AI绘图 x 卫星 :satellite:
地球,一个拥有生命的星球,在宇宙中漂浮着一颗蓝色行星。它位于太阳系的中心位置,是太阳系中最大的行星和最小的恒星之一。它的表面覆盖着丰富的生态系统,包括海洋、陆地和森林等生物群落。它拥有独特的气候和环境条件,如强烈的风暴、地震和火山喷发。同时,它也面临着来自太阳和其他天体的辐射威胁,以及人类活动的影响。然而,尽管如此,地球仍然继续保护着我们免受极端天气和自然灾害的威胁。——文心一言。
2023-09-04 22:10:07
274
1
原创 NLP学习-昇思AI学习赛-图书评论分类
昇思AI学习赛于2023年3月正式开启,面向全球AI开发者,赛题与深度学习紧密结合,多重好礼等你来拿。文本分类研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,在AI领域承担了重要角色。本赛题旨在让参赛者熟悉MindSpore并锻炼参赛者使用MindSpore进行文本分类的能力。为熟悉华为的mindspore框架和了解NLP,我参加了文本分类这一赛道。
2023-08-25 21:21:37
87
2
原创 《MP-Former: Mask-Piloted Transformer for Image Segmentation》解读
具体地,MP-Former在Mask2Former原有的解码器层上增加掩膜引导部分,通过每一层注入带有噪声的真值掩膜引导注意力,既提高了掩膜预测的一致性,也让模型在“去噪”的过程中强化鲁棒性。本文没有很清楚解释将类别嵌入向量作为查询的动机,但是考虑到解码器层预测掩膜的过程其实就是查询嵌入向量同图像特征点积计算,在解码器初始几层查询往往不够准确,导致初始几层掩膜不准确,引入真值类别嵌入向量作为查询等同于一个很好的初始点,能够帮助网络更快找到目标,同时和其他类别的目标能够区分。(3)标签引导的训练。
2023-08-14 13:46:59
758
原创 构建图像分割任务的统一架构——从 MaskFormer 到 Mask2Former 再到 MP-Former
受到大语言模型的启发,视觉领域也掀起构建“大一统”框架的热潮。基于选定的MP-Former论文(CVPR 2023),本文回溯该工作的基础Mask2Former(CVPR 2022)和这一系列工作的起源MaskFormer(NeuraIPS 2021),介绍与分析了从MaskFormer到MP-Former的“变化”与“不变”。“不变”的是统一语义分割、实例分割、全景分割等图像分割任务的初心,“变化”的是更优的分割精度与更高的训练效率。
2023-08-14 13:37:32
2942
原创 学习遥感大模型(1)
根据非盈利组织忧思科学家联盟(The Union of Concerned Scientists),截止2023年1月,全球对地观测卫星在轨数目已超过1000颗。大量的对地观测卫星很大程度解决遥感数据匮乏的困境,随之而生的问题是海量遥感大数据需要更加智能的自动分析算法。大数据催生大模型,ChatGPT、SAM的涌现为遥感智能解译领域带来新的启发,能否基于海量遥感数据无监督地训练一个参数量巨大的强泛化性模型作为底座,通过极低成本的适配来服务于各个下游任务?
2023-07-11 13:16:23
3692
6
原创 AIGC & 遥感 & 大模型 卫星影像有什么不同吗?
大模型热,AIGC热忽如一夜春风来,站在遥感×AI的十字路口,结合读到的一些论文不禁展开一些畅想。
2023-06-27 00:06:41
920
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人