- 博客(70)
- 收藏
- 关注
翻译 论文翻译《ReCo: Region-Controlled Text-to-Image Generation》
最近,大规模文本到图像(T2I)模型展现出了令人印象深刻的性能,在生成高保真图像方面表现出色,但其可控性有限,例如,精确指定特定区域的内容,通过自由形式的文本描述。在本文中,我们提出了一种有效的技术,用于T2I生成中的区域控制。我们通过额外添加一组位置标记来增强T2I模型的输入,这些标记代表了量化的空间坐标。每个区域由四个位置标记来指定,分别表示左上角和右下角,然后是一个开放式的自然语言区域描述。然后,我们使用这种新的输入界面对预训练的T2I模型进行微调。
2024-06-17 22:29:45
441
原创 论文阅读《LayoutDiffusion: Controllable Diffusion Model for Layout-to-image Generation》
本文提出了一种用于布局到图像生成的扩散模型LayoutDiffusion;将图像的每个块作为一个特殊的对象,以统一的形式完成布局和图像的困难多模态融合;提出了布局融合模块(LFM)、对象感知交叉注意机制(OaCA)。布局图实际上是一系列物体在图片上的布局信息,一个布局序列中的每个对象o都对应着图片中的一个物体,每个对象由2D边界框和该物体的类别标签组成。
2024-05-21 20:12:50
2159
1
翻译 论文翻译《LayoutDiffusion: Controllable Diffusion Model for Layout-to-image Generation》
最近,扩散模型在图像合成方面取得了巨大成功。然而,在布局到图像的生成过程中,图像往往是由多个物体组成的复杂场景,如何对全局布局图和每个细节物体进行强有力的控制仍然是一项具有挑战性的任务。在本文中,我们提出了一种名为 “布局扩散”(LayoutDiffusion)的扩散模型,与之前的研究相比,它能获得更高的生成质量和更强的可控性。为了克服图像
2024-05-21 19:26:55
921
原创 论文阅读《Toward Multimodal Image-to-Image Translation》
将真实图像编码到隐空间中,使用编码器将真实图像进行潜在编码,再将编码后的随机噪声和输入图像进行结合生成输出。条件生成器从随机抽样的隐向量产生一个输出,当它作为输入给编码器时,编码返回与随机抽样相同的隐向量。将上述两种方法结合起来,构成双向映射的结构对于PixPixGAN而言,生成器更多地依赖于输入图像的具体内容而非随机噪声来重建输出。因此,即使添加了噪声,只要输入图像信息足够丰富,生成的输出仍然会依照输入的结构和特征进行构建。与传统的pix2pix模型不同,BicycleGAN在生成过程中引入了隐变量。
2024-05-17 15:52:14
1177
1
翻译 论文翻译《Toward Multimodal Image-to-Image Translation》
许多图像到图像的转换问题是模糊的,因为单个输入图像可能对应多个可能的输出。在这项工作中,我们的目标是在条件生成建模设置中对可能输出的分布进行建模。映射的模糊性被提取到一个低维的隐向量中,该隐向量可以在测试时随机采样。生成器学习将给定的输入与隐代码相结合,映射到输出。我们明确地鼓励输出和隐代码之间的连接是可逆的。这有助于防止在训练期间从隐代码到输出的多对一映射,也称为模式崩溃问题,并产生更多样化的结果。我们通过使用不同的训练目标、网络架构和注入隐代码的方法来探索这种方法的几种变体。
2024-05-10 21:10:13
125
原创 论文阅读《Semantic Prompt for Few-Shot Image Recognition》
本文提出了一种新颖的语义提示方法,利用类名的文本信息作为语义提示,自适应地调整特征提取网络,使得图像编码器只关注和语义提示相关的视觉特征,忽略其他干扰信息。本文主要提出了一个语义提示SP模块和模块中两种互补的信息交互机制:1、SP模块:可以插入到特征提取器的任何层中,包含空间和通道交互部分。2、空间交互机制:将语义提示特征和图像块特征串联在一起,然后送入Transformer层中,通过自注意力层,语义提示可以和每个图像块特征进行信息交互从而使模型关注类别相关的图像区域。
2024-04-07 21:40:35
1238
1
翻译 论文翻译《Semantic Prompt for Few-Shot Image Recognition》
小样本学习是一个具有挑战性的问题,因为只有很少的例子可以识别一个新的类。最近的一些研究利用额外的语义信息,例如类名的文本嵌入,通过结合语义原型和视觉原型来解决稀少样本的问题。然而,这些方法仍然会受到从稀少的支持样本中学习到的虚假视觉特征的影响,从而导致有限的性能增益。在本文中,我们提出了一种新颖的面向小样本学习的语义提示方法
2024-03-09 14:09:32
309
原创 论文阅读《Sylph: A Hypernetwork Framework for Incremental Few-shot Object Detection》
针对增量小样本学习问题,探索一种可以快速从小样本中学习新类别,又不会忘记以前见过的类别的模型Sylph,且不需要对模型参数进行任何额外的优化。面对新类别会直接训练,不用联合训练(连带着基类和已经学习到的新类别一起训练)在基础训练的时候训练出一个和类别无关的回归器,在适应新类别时,只需要用这个回归器进行定位操作就可以了;因此只需要考虑小样本分类问题,只关注分类器的参数;训练新类别时,生成一组新的分类器参数(新类类代码),再通过元测试阶段将新类类代码和基类类代码合成在一起。
2024-02-22 18:10:41
1786
2
翻译 论文翻译《Sylph: A Hypernetwork Framework for Incremental Few-shot Object Detection》
我们研究的是具有挑战性的增量小样本目标检测(iFSD)。最近,在连续和无微调 iFSD 的背景下研究了基于超网络的方法,但成效有限。我们对此类方法的重要设计选择进行了仔细研究,并进行了几项关键改进,最终形成了一个更精确、更灵活的框架,我们称之为 Sylph。特别是,我们在大规模数据集上利用预先训练好的无类别的定位基础检测器,证明了将物体分类与定位解耦的有效性。
2024-01-24 16:01:27
376
2
原创 【代码调试】《Multi-scale Positive Sample Refinement for Few-shot Object Detection》
我的配置:Python :3.6.5(ubuntu20.04)Pytorch :1.9.0Cuda :11.1GPU:RTX 3090 Ti(24GB)
2023-05-16 21:07:09
1037
6
原创 【代码调试】《Frustratingly Simple Few-Shot Object Detection》
论文地址:[https://arxiv.org/abs/2003.06957](https://arxiv.org/abs/2003.06957)论文代码:[https://github.com/ucbdrive/few-shot-object-detection](https://github.com/ucbdrive/few-shot-object-detection)
2023-04-20 16:41:21
1778
23
原创 论文阅读《Integrative Few-Shot Learning for Classification and Segmentation》
小样本分类问题:FS-C,总是事先假定查询图像中包含且只包含一个目标类,这个目标类属于支持类中,且支持集中的各个类之间不能存在包含关系,如{苹果,橘子,水果,桌子,椅子,家具}这种类别设置是不允许的。小样本图像分割问题:FS-S,当查询图像中不包含目标类别时,会选择分割出图像中最显著的部分。
2023-03-20 13:42:45
532
1
翻译 论文翻译《Integrative Few-Shot Learning for Classification and Segmentation》
我们介绍了小样本分类和分割(FS-CS)的集成任务,目的是在目标类给出的例子很少的情况下,对查询图像中的目标对象进行分类和分割。该任务结合了两个传统的小样本学习问题,小样本分类和分割。FS-CS将它们推广到具有任意图像对的更真实的任务中,其中每个目标类可能出现在查询图像中,也可能不出现在查询图像中。为了解决这一任务,我们提出了FS-CS的综合小样本学习。
2023-03-14 14:44:14
626
1
翻译 论文翻译《Cascade R-CNN: Delving into High Quality Object Detection》
在目标检测中,需要一个交并比(IoU)阈值来定义阳性和假阳性。用低IoU阈值(例如0.5)训练的目标检测器通常会产生噪声检测。但是,随着IoU阈值的增加,检测性能往往趋于下降。造成这种情况的两个主要因素是:1)训练期间的过拟合,由于正样本的指数消失;2)检测器最优的IoU与输入建议框之间的推断时间不匹配。为了解决这些问题,提出了一种多级目标检测体系结构Cascade R-CNN。它由一系列检测器组成,这些检测器经过不断增加的IoU阈值训练,从而对接近的假阳性有更强的选择性。
2023-02-20 16:59:39
270
1
原创 【代码调试】《FSCE: Few-Shot Object Detection via Contrastive Proposal Encoding》
【代码调试】《FSCE: Few-Shot Object Detection via Contrastive Proposal Encoding》Python :3.8(ubuntu18.04)Pytorch :1.6.0Cuda :10.1GPU:RTX 2080 Ti(11GB) * 2
2022-12-29 22:02:53
3596
41
原创 论文阅读《FSCE: Few-Shot Object Detection via Contrastive Proposal Encoding》
本文提出了一种基于对比建议编码(FSCE)的小样本目标检测方法,在RoI 特征提取后添加了一个和回归、分类分支并行的建议框对比编码(CPE)分支。
2022-12-23 21:28:01
1074
1
翻译 论文翻译《FSCE: Few-Shot Object Detection via Contrastive Proposal Encoding》
近些年来,人们开始对识别以前从未见过的物体产生兴趣,这种使用很少的样本进行训练的目标检测任务被称为小样本目标检测(FSOD)。最近的研究表明,良好的特征嵌入是获得良好的小样本学习性能的关键。我们观察到,具有不同的IoU分数的目标建议框议类似于对比方法中使用的图像内增强。我们利用这种类比并结合监督对比学习,在FSOD中实现更健壮的目标表示。我们提出了一些通过对比建议编码(FSCE)的小样本目标检测方法,这是一种简单而有效的来学习对比感知的对象建议编码的方法,有助于对检测到的目标进行分类。
2022-12-23 21:20:07
631
原创 论文阅读《Dense Relation Distillation with Context-aware Aggregation for Few-Shot Object Detection》
在以往的小样本目标检测工作中,支持特征和查询特征之间的关系没有得到充分的发掘和利用,传统方法利用支持特征的全局池化生成的分类向量来调整查询特征,从整体角度指导特征学习。然而,由于外观变化或遮挡在自然图像中是常见的,当同一类对象在查询和支撑样本之间变化很大时,整体特征可能会产生误导。另外,当大部分物体由于遮挡而看不见时,局部上下文细节丢失,这时局部细节特征的检索变得非常重要,而以往的方法完全忽略了这一点。同时,小样本目标检测问题中,多尺度特征提取器存在基类和新类过拟合的问题。
2022-11-09 21:03:38
443
1
翻译 论文翻译《Dense Relation Distillation with Context-aware Aggregation for Few-Shot Object Detection》
传统的基于深度学习的物体检测方法需要大量的边界框注释来进行训练,获取如此高质量的标注数据代价高昂。小样本目标检测在只有少数注释实例的情况下学习适应新的类别,这是一种非常具有挑战性的方法,因为在只有少量可用数据的情况下,新对象的细粒度特征很容易被忽略。在本文中,为了充分利用带注释的新对象的特征,获取查询对象的细粒度特征,我们提出了基于上下文感知聚合的密集关系蒸馏法(DCNet)来解决小样本目标检测的问题。
2022-11-07 11:19:33
458
2
原创 论文阅读《Semantic Relation Reasoning for Shot-Stable Few-Shot Object Detection》
本文提出一种SRR-FSD算法,尝试在使用视觉信息的同时使用语义关系,并且将显式的关系推理引入到小样本目标检测中。
2022-09-22 16:11:53
1790
原创 长尾分布(long-tailed distributions)
如果把不同类别的数据按照出现的频率从高到低进行排序,就会得到一条递减的曲线。在曲线的头部,数据出现的频率很高,随着数据的出现频率逐渐降低,曲线也逐渐下降,缓慢趋近于横轴,看起来就像拖着一条长长的尾巴。
2022-09-14 16:38:35
9472
原创 Python—argparse模块
argparse 模块可以让人轻松编写用户友好的命令行接口。程序定义它需要的参数,然后 argparse 将弄清如何从 sys.argv 解析出那些参数。argparse 模块还会自动生成帮助和使用手册,并在用户给程序传入无效参数时报出错误信息。
2022-08-24 17:55:44
783
原创 经典进程同步问题——读者写者问题
问题描述写者优先要求:为了防止“读者优先”可能导致的写者饥饿,可以考虑写者优先。即,当共享数据区被读者占用时,后续紧邻到达的读者可以继续进入,若这时有一个写者到来并阻塞等待,则写者后续到来的读者全部阻塞等待。即只要有一个写者申请写数据,则不再允许新的读者进程进入读数据。这样,写者只需等待先于它到达的读者完成其读数据的任务,而不用等待其后到达的读者。新读者:如果无读者、写者,新读者可以读。如果有写者等待,且有其它读者正在读,新读者等待。如果有写者写,新读者等待。新写者:如果无读者,新写者可以
2021-07-20 14:19:59
2036
原创 经典进程同步问题——生产者消费者问题
问题描述“生产者—消费者”问题 (producer/consumer problem) 是最著名的进程同步问题。该问题描述了共享固定大小缓冲区的两个线程——即所谓的“生产者”和“消费者”——在实际运行时会发生的问题。生产者的主要作用是生成一定量的数据放到缓冲区中,然后重复此过程。与此同时,消费者也在缓冲区消耗这些数据。该问题的关键就是要保证生产者不会在缓冲区满时加入数据,消费者也不会在缓冲区中空时消耗数据。它是许多相互合作进程的抽象,如输入进程与计算进程;计算进程与打印进程等。要解决该问题,就必须
2021-07-20 14:05:06
5430
原创 经典进程同步问题——哲学家就餐问题
问题描述有五个哲学家,他们的生活方式是交替地进行思考和进餐。他们共用一张圆桌,分别坐在五张椅子上。在圆桌上有五个碗和五支筷子,平时一个哲学家进行思考,饥饿时便试图取用其左、右最靠近他的筷子,只有在他拿到两支筷子时才能进餐。进餐完毕,放下筷子又继续思考。哲学家进餐问题可看作是并发进程并发执行时处理共享资源的一个有代表性的问题。初始解法:Var chopsitck:array[0,1,2,3,4] of semaphore=1;/*5支筷子分别设置为初始值为1的互斥信号量*/第i个哲学家的活动r
2021-07-20 13:25:58
1190
原创 Jupyter Notebook默认路径的修改
这东西搞得我好烦,重装之后想要修改默认路径,结果忘记如何修改了。为了防止以后还要重装,就在这里记录一下吧。一、打开cmd,进入Anaconda安装目录输入jupyter notebook --generate-config二、按照给出的路径寻找Jupyter_notebook_config.py文件三、记事本打开该文件,搜索"#c.NotebookApp.notebook_dir ="四、将"#"去掉,在后面的引号中输入想修改的默认工作路径五、点击Jupyter Notebook的属
2021-07-06 13:13:45
234
原创 第十届蓝桥杯省赛B组(C/C++组)
目录A: 组队B: 不同子串C: 数列求值A: 组队【问题描述】作为篮球队教练,你需要从以下名单中选出 1 号位至 5 号位各一名球员,组成球队的首发阵容。每位球员担任 1 号位至 5 号位时的评分如下表所示。请你计算首发阵容 1号位至 5 号位的评分之和最大可能是多少?【答案提交】这是一道结果填空的题,你只需要算出结果后提交即可。本题的结果为一个整数,在提交答案时只填写这个整数,填写多余的内容将无法得分。B: 不同子串【问题描述】一个字符串的非空子串是指字符串中长度至少为 1 的连续的一段
2021-04-16 10:04:18
222
原创 第十一届蓝桥杯省赛B组(C/C++组)(第二场)
目录A:门牌制作B:既约分数C:蛇形填数D:跑步锻炼A:门牌制作【问题描述】小蓝要为一条街的住户制作门牌号。这条街一共有 2020 位住户,门牌号从 1 到 2020 编号。小蓝制作门牌的方法是先制作 0 到 9 这几个数字字符,最后根据需要将字符粘贴到门牌上,例如门牌 1017 需要依次粘贴字符 1、0、1、7,即需要 1 个字符 0,2 个字符 1,1 个字符 7。请问要制作所有的 1 到 2020 号门牌,总共需要多少个字符 2?【答案提交】这是一道结果填空的题,你只需要算出结果后
2021-03-26 21:36:16
231
原创 第十一届蓝桥杯省赛B组(C/C++组)(第一场)
目录A:跑步训练B:纪念日C:合并检测D:REPEAT程序矩阵F:整除序列G:解码A:跑步训练【题目描述】小明要做一个跑步训练。初始时,小明充满体力,体力值计为 10000。如果小明跑步,每分钟损耗 600 的体力。如果小明休息,每分钟增加 300 的体力。体力的损耗和增加都是 均匀变化的。小明打算跑一分钟、休息一分钟、再跑一分钟、再休息一分钟……如此循环。如果某个时刻小明的体力到达 0,他就停止锻炼。请问小明在多久后停止锻炼。为了使答案为整数,请以秒为单位输出答案。答案中只填写数,不填写单位
2021-03-23 21:29:21
317
原创 C++识别数字
识别数字(10分)题目内容:编写函数,输出字符串中的所有整数。要考虑正、负数。编写主函数,输入带空格的字符串,调用函数输出其中的整数。输入格式:一行,表示一个句子,中间可能有空格,有若干整数。输出格式:一行,若干整数,用一个空格隔开,末尾无空格。注意:单独符号不算数字,但-0为0,+0也为0。输入样例:CHINA DAILY | Updated: 2020-03-21 07:5...
2020-12-29 12:52:31
1764
原创 练习Day——20
打印十字图(PRE-2)(存疑)题目描述小明为某机构设计了一个十字型的徽标(并非红十字会啊),如下所示:样例输入11样例输出1样例输入23样例输出2提示请仔细观察样例,尤其要注意句点的数量和输出位置。import java.util.Scanner;public class Main { public static void main(String []args) { Scanner scan=new Scanner(System.in); int n=scan.
2020-12-29 12:51:48
149
转载 fork()系统调用
在Linux系统内,创建子进程的方法是使用系统调用fork()函数。fork()函数是Linux系统内一个非常重要的函数,它与我们之前学过的函数有一个显著的区别:fork()函数调用一次却会得到两个返回值。
2020-11-04 14:32:05
1731
原创 练习Day——19(2016年第七届蓝桥杯Java B组)
目录一、煤球数目二、生日蜡烛三、凑算式四、分小组五、抽签六、方格填数七、剪邮票八、四平方和九、取球博弈十、压缩变换一、煤球数目有一堆煤球,堆成三角棱锥形。具体:第一层放1个,第二层3个(排列成三角形),第三层6个(排列成三角形),第四层10个(排列成三角形),…如果一共有100层,共有多少个煤球?请填表示煤球总数目的数字。注意:你提交的应该是一个整数,不要填写任何多余的内容或说明性文字。二、生日蜡烛某君从某年开始每年都举办一次生日party,并且每次都要吹熄与年龄相同根数的蜡烛。现
2020-09-27 19:12:10
285
原创 练习Day——18(2015年第六届蓝桥杯Java B组)
目录一、三角形面积二、立方变自身三、三羊献瑞四、循环节长度五、九数组分数一、三角形面积如下图所示。图中的所有小方格面积都是1。
目录一、武功秘籍二、切面条三、猜字母四、大衍数列五、圆周率六、奇怪的分式七、扑克排序八、分糖果一、武功秘籍小明到X山洞探险,捡到一本有破损的武功秘籍(2000多页!当然是伪造的)。他注意到:书的第10页和第11页在同一张纸上,但第11页和第12页不在同一张纸上。小明只想练习该书的第81页到第92页的武功,又不想带着整本书。请问他至少要撕下多少张纸带走?这是个整数,请通过浏览器提交该数字,不要填写任何多余的内容。答案:781、(82,83)、(84,85)、(86,87)、(88,89)、(90,
2020-09-14 20:37:31
299
原创 练习Day——16
目录结点选择(ALGO-4)最短路(ALGO-5)结点选择(ALGO-4)问题描述有一棵 n 个节点的树,树上每个节点都有一个正整数权值。如果一个点被选择了,那么在树上和它相邻的点都不能被选择。求选出的点的权值和最大是多少?输入第一行包含一个整数 n 。接下来的一行包含 n 个正整数,第 i 个正整数代表点 i 的权值。接下来一共 n-1 行,每行描述树上的一条边。输出输出一个整数,代表选出的点的权值和的最大值。样例输入51 2 3 4 51 21 32 42 5样例输出
2020-09-07 14:47:52
301
原创 练习Day——15(动态规划)
动态规划目录动态规划方格取数数的划分装箱问题传球游戏传纸条入学考试开心的金明方格取数题目描述设有N*N的方格图(N< =10),我们将其中的某些方格中填入正整数,而其他的方格中则放入数字0。某人从图的左上角的A 点(1,1)出发,可以向下行走,也可以向右走,直到到达右下角的B点(N,N)。在走过的路上,他可以取走方格中的数(取走后的方格中将变为数字0)。此人从A点到B 点共走两次,试找出2条这样的路径,使得取得的数之和为最大。输入输入的第一行为一个整数N(表示N*N的方格图),接下
2020-09-02 19:43:34
452
原创 练习Day——14
目录芯片测试星际交流Sine之舞(BASIC-21)芯片测试题目描述有n(2≤n≤20)块芯片,有好有坏,已知好芯片比坏芯片多。每个芯片都能用来测试其他芯片。用好芯片测试其他芯片时,能正确给出被测试芯片是好还是坏。而用坏芯片测试其他芯片时,会随机给出好或是坏的测试结果(即此结果与被测试芯片实际的好坏无关)。给出所有芯片的测试结果,问哪些芯片是好芯片。输入输入数据第一行为一个整数n,表示芯片个数。第二行到第n+1行为n*n的一张表,每行n个数据。表中的每个数据为0或1,在这n行中的第i行第j列
2020-08-16 16:29:15
173
原创 练习Day——13
目录龟兔赛跑预测数的读法公式求值龟兔赛跑预测题目描述话说这个世界上有各种各样的兔子和乌龟,但是 研究发现,所有的兔子和乌龟都有一个共同的特点——喜欢赛跑。于是世界上各个角落都不断在发生着乌龟和兔子的比赛,小华对此很感兴趣,于是决定研究不同兔 子和乌龟的赛跑。他发现,兔子虽然跑比乌龟快,但它们有众所周知的毛病——骄傲且懒惰,于是在与乌龟的比赛中,一旦任一秒结束后兔子发现自己领先t米或以 上,它们就会停下来休息s秒。对于不同的兔子,t,s的数值是不同的,但是所有的乌龟却是一致——它们不到终点决不停止
2020-08-13 21:47:32
247
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人