- 博客(28)
- 收藏
- 关注
原创 SAM解码器的代码理解(二)
经过两个叠加的双向注意力模块和最后一个token-image交叉注意力后,输出Query和Keys(具体过程可见上一篇文章中TwoWayTransformer代码)。其中,Query中的第一个向量为下图中的iou_out,后面的向量为mask_out。Keys为下图中的src。
2024-12-29 12:29:33
509
原创 SAM解码器的代码理解(一)
查询为点嵌入,键为图像嵌入。先通过两个重复的TwoWayAttentionBlock,最后通过一个token-image交叉注意力。SAM解码器中的双向注意力模块由自注意力、交叉注意力、MLP、交叉注意力四个步骤组成。具体过程通过阅读注释可以基本理解。建议先理解TwoWayAttentionBlock类,再理解TwoWayTransformer,并对照流程图看。对SAM解码器其他部分理解见下一篇。
2024-12-29 11:24:16
422
原创 Learning in the Frequency Domain | 论文笔记
论文链接:[2002.12416] Learning in the Frequency Domain (arxiv.org)https://arxiv.org/abs/2002.12416论文代码:kaix90/DCTNet (github.com)https://github.com/kaix90/DCTNeta)在传统方法中,高分辨率的RGB图片通常在CPU上进行预处理,然后转移到GPU上进行推理。因为没有经过压缩的RGB图片很大,所以CPU和GPU之间的传输带宽(CB)要求很高。为减少计算代价和传输带
2023-12-10 14:30:54
1186
原创 Pytorch图像分类器
对于该例,我们将使用CIFAR10数据集,它包含十个类别:‘airplane’, ‘automobile’, ‘bird’, ‘cat’,‘deer’, ‘dog’, ‘frog’, ‘horse’, ‘ship’, ‘truck’。CIFAR-10 中的图像尺寸为3*32*32,也就是RGB的3层颜色通道,每层通道内的尺寸为32*32。torchvision 数据集的输出是范围在[0,1]之间的 PILImage,我们将他们转换成归一化范围为[-1,1]之间的张量 Tensors。3)定义一个损失函数。
2023-12-04 10:05:21
446
原创 FcaNet: Frequency Channel Attention Networks | 论文笔记
从1)中证明的定理可知,在通道注意力中使用GAP意味着只有最低频的信息被保留了,所有其他频率的分量都被忽略了,但因为它们在表示通道中都包含了有用的信息,所以不应该被忽略掉。1)通常来说,由于有限的计算资源开销,通道注意力机制需要对每个通道的标量进行计算来获得权重函数,而全局平均池化(GAP)操作由于其易用性和高效性无疑是最佳的选择。2)选用其他频率分量(除最高频率分量外)时,它们的Top-1 accuracy比最低频率分量的只少了0.5%以内,说明其他频率分量在通道注意力机制中也同样有效。
2023-12-03 14:06:12
1150
原创 SQL教程
关系模型把数据看作是一个二维表格,表和表之间需要建立“一对多”,“多对一”和“一对一”的关系主流关系数据库OracleSQL ServerDB2等MySQLPostgreSQL等桌面数据库,以微软Access为代表,适合桌面应用程序使用嵌入式数据库,以Sqlite为代表,适合手机应用和桌面程序。
2023-10-16 22:59:38
67
原创 TS流解析
数字机顶盒接收到的传输流,其携带的信息有:视频、音频、PAT、PMT等ES流:音频码流或视频码流PES流:ES流分段,并加上相应头部PS流:节目流TS流:一个或多个PES流组合而成。
2023-10-16 22:57:47
126
原创 并发程序设计
如果没有顾客,理发师便在理发椅上睡觉,一个顾客到来时,它必须叫醒理发师,如果理发师正在理发时又有顾客到来,则如果有空椅子可坐,就坐下来等待,否则就离开。信号量的物理意义:信号量S的出初值表示可用资源数,当S≤0时,表示已无资源可分配,其绝对值表示此时在等待队列中等待分配资源的进程数。设系统某类资源有m个,有n个进程,每个进程需要k个该资源,则当满足nk ≤ m + (n - 1)时,系统不会引起死锁。P(s):将信号量s减去1,若结果小于0,则调用P(s)的进程被置成等待信号量s的状态。
2023-05-09 16:03:33
278
原创 处理器管理
每个程序都有一个与其执行相关的PSW,每个处理器都设置一个PSW寄存器,程序占有处理器执行,它的PSW将占有PSW寄存器。作用:用来控制指令执行顺序并保留和指示与程序有关的系统状态,主要作用是实现程序状态的保护和恢复。2、进程上下文:进程物理实体和支持进程运行的环境。3、缺点:核心只将处理器分配给进程,同一进程中的两个线程不能同时运行于两个处理器上。1、定义:由操作系统的内核建立、调度和管理的线程。1、进程的内存映像:进程某时刻的内容和状态集合。1、定义:由用户应用程序建立、调度和管理的线程。
2023-05-07 22:35:46
156
原创 计算机操作系统概述
管理系统资源、控制程序执行、改善人机界面、提供各种服务,并合理组织计算机工作流程和为用户方便有效地使用计算机提供良好运行环境的一种系统软件。优点:提高CPU、内存、I/O设备的利用率,增加系统吞吐量,充分发挥了系统的并行性。计算机硬件、操作系统(系统软件)、支撑软件、应用软件、用户。虚拟机的组成:虚处理器、虚拟内存、虚拟辅存、虚拟设备。操作系统资源管理技术:复用、虚拟和抽象。操作系统三个基本抽象:进程、虚存和文件。操作系统的历史、分类、常见的操作系统。操作系统的定义、作用、功能和特征。
2023-05-05 15:18:55
133
原创 《电磁场与电磁波》---恒定电场思维导图
《电磁场与电磁波》比较抽象,重点是理解众多公式的物理意义,并了解其内在联系。现以公式为导向,整理了恒定磁场中的思维导图,带公式的版本将下次发布。
2022-11-16 23:27:10
2550
原创 《计算机网络》---简答题(二)
计算机网络的简答题没有固定的答案,主要考察的是对计算机网络中的原理、概念的理解,抓住关键要点即可,现列举计算机网络中常考察的简答题。
2022-11-13 12:57:46
313
原创 《计算机网络》---简答题(一)
计算机网络的简答题没有固定的答案,主要考察的是对计算机网络中的原理、概念的理解,抓住关键要点即可,现列举计算机网络中常考察的简答题。
2022-11-13 05:30:00
420
原创 《计算机网络》---IP地址划分
在计算机网络的实际应用中,需要根据使用对象的不同,划分不同的子网,并分配不同数目的主机数,在IP地址划分中,有一定的规则和规律可遵循。
2022-11-06 10:57:48
406
原创 《计算机网络》---CRC校验
计算机网络的数据链路层具有差错检测的功能,其中进行差错检测的主要两种方法是奇偶校验和循环冗余校验(CRC),奇偶校验只能检测出奇数个比特错误,CRC校验能够检测出一定数量的比特错误。
2022-11-05 16:35:00
1927
原创 神经网络图文检索模型预测代码学习总结(一)
本文主要总结神经网络图文检索部分语义对齐模型的代码,主要用于记录笔者的学习过程,如有不准确之处,欢迎各路大神指出!谢谢!
2022-08-01 23:07:00
752
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人