- 博客(21)
- 收藏
- 关注
原创 【pytorch】keepdim参数解析
(默认值):归约操作后,所归约的维度会被移除,张量的维度会减少。:归约操作后,所归约的维度会被保留,张量的维度不变,但该维度的大小变为 1。这是在处理张量形状时非常有用的功能,尤其是在需要保持张量形状一致性的场景下(比如在某些层归一化操作或在神经网络中)。
2024-09-06 16:54:30
650
原创 【pytorch】register_buffer的使用
自动注册: 任何类型的属性会自动成为模型的参数。nn.Module子类: 任何包含在nn.Module中的子模块(如nn.Conv2d)会自动注册为模型的一部分。需要手动注册非可训练的常量(buffers:需要使用来显式注册,它们不参与梯度计算,但会保存、加载以及转移到设备。
2024-09-06 10:36:02
1327
原创 【大规模语言模型:从理论到实践】Transformer中MultiHeadAttention详解
【代码】【大规模语言模型:从理论到实践】Transformer中MultiHeadAttention详解。
2024-09-05 21:20:28
198
原创 CoOp代码中TextEncoder类解析
这句代码的目的是从 transformer 编码后的序列中,提取每个序列的 EOT 标记(即文本结束标记)对应的特征,然后通过一个线性投影矩阵对这些特征进行变换,生成最终的文本特征表示。这种操作通常用于提取代表整个文本序列的特征向量,供后续任务使用,比如分类、对比学习等。
2024-08-18 17:17:36
392
1
原创 数据结构与算法要点总结(8):图的存储、图的遍历、最小生成树、最短路径、活动网络
DFS由于有回溯这个步骤,因此需要记录"来时路",因此需要使用栈或递归。BFS是一层一层 or 一圈一圈进行的,因此需要借助队列。
2024-01-06 17:19:32
1017
1
原创 数据结构与算法要点总结(7):静态搜索表、二叉搜索树、AVL树
一棵 AVL 树或者是空树,或者是具有下列性质的二叉搜索树:它的左子树和右子树都是 AVL 树,且左子树和右子树的高度之差的绝对值不超过1。
2024-01-01 21:41:41
1097
原创 概率论与数理统计经典问题:夫妻匹配问题合集
将n对夫妻任意分成n组,每组⼀男⼀⼥/每组2⼈,不限男⼥,问1、所有夫妻都没有分到同⼀组的概率?2、⾄少有⼀对夫妻被分到同⼀组的概率?3、每⼀对夫妻都恰好分到同⼀组的概率?4、⽤X表示夫妻两⼈被分到⼀组的对数, 求X的期望
2024-01-01 15:38:22
886
原创 数据结构与算法要点总结(6):集合、并查集、字典、散列表(哈希表)
设 hash1(key)=d , 当其地址d已经被其他元素占有了,则计算 hash2(key) =c, 在表中顺次检查相应的地址 d+c, d+2c, d+3c……失败的情况:分母为散列函数可能算出的所有地址的个数,分子为每个位置一直比较到空位置或最开始映射的位置的次数之和。字典是一些元素的集合,每个元素有一个称作关键码(key)的域,不同元素的关键码互不相同。成功的情况:分母为被映射的元素的个数,分子为每个元素比较次数的总和。个元素的有序表,在等概率查找情况下,折半查找的平均查找长度为。
2023-12-31 12:02:50
953
原创 数据结构与算法要点总结(4):数组、矩阵、字符串、广义表
一维数组与一位数组的推广:一维数组与多维数组、特殊矩阵、稀疏矩阵。线性表的运用:字符串。广义表:一种递归形式的表。
2023-12-29 16:00:26
444
1
原创 数据结构与算法要点总结(3):栈、队列、优先队列
栈、队列也是线性结构,但是它们与线性表不同,区别在于:它们限制存取位置。队列是只允许在一端删除,在另一端插入的顺序表。允许删除的一端叫做队头(front),允许插入的一端叫做队尾(rear)。
2023-12-29 15:08:30
776
1
原创 人工智能导论笔记【第三章】
叶子节点的值可以直接计算,但有可能搜不到叶子节点,因此对于中间节点可以设计估值函数,设定最大搜索深度,采用截断搜索。节点包括终结节点和中间节点,终结节点的效用可以直接计算,中间节点的效用值由状态效用值反映(取最大值)。遍历孩子节点的顺序也会影响执行效率:对节点的排序会带来额外计算量,同样是平衡问题。期望最大搜索算法不能剪枝:计算期望时,需要获得所有孩子节点的效用值。α代表在这条路径中,最大值节点的最佳选择;β代表在这条路径中,最小值节点的最佳选择。中控函数:判定节点状态,选择对应函数。
2023-09-26 11:51:34
189
1
原创 人工智能导论笔记【第二章】
S,再A和B比,扩展B,再A和C比,扩展C,再A和G比,扩展A,再C和G比,f(C)小,但是,C已经被扩展过,不再次扩展,扩展G。在实际运用中,A*算法的启发式函数可能不是可采纳的或一致的,但仍然可以加速搜索。情况2的极端情况:开始节点直接连A、B,则A的所有祖先节点都在B之前展开。希望S->A->C中的C早于S->B->C中的C。已知,h(n)
2023-09-20 19:21:59
1012
1
原创 人工智能导论笔记【第一章】
closed:集合形式,用来保存已经被访问过的节点。s->d->e不可能好于s->e,一个状态被再次访问时,很可能并非最优。状态空间图:每个状态只出现一次,可能出现环。空间复杂度:计算要保存的已经发现而未被访问的最大节点个数。搜索树:无环,节点和状态一般不是一一对应而是多对一的。fringe:用来保存已经被发现但还未被访问的节点。fringe n.条纹,边缘,附带--->搜索边缘。深搜演示---清楚演示了其中栈的运行逻辑。图搜索:不重复访问
2023-09-20 18:38:55
348
1
论文阅读Vision-Language Models for Vision Tasks A Survey思维导图
2023-11-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人