霸啵奔-优快云博客

原创 Transformer详解

transpose就是转置，不过这里指定第 1 维和第 2 维互换，即将形状（shape）从 `(batch_size, seq_len, num_heads, head_dim)` 转换为 `(batch_size, num_heads, seq_len, head_dim)`。如果 `embed_size=512` 且 `num_heads=8`，则每个头的 `head_dim=64`。该操作将原始的 `embed_size` 拆分为 `num_heads` 个 `head_dim`。

2025-07-03 17:15:06 1280

原创从0开始训练大模型

为什么要预训练： 1、语言不匹配：大多数开源基座对中文的支持都不太友好，在英文上效果优秀，但是中文差强人意。 2、专业知识不足：需要专业领域的LLM时候，预训练模型中的知识就尤为重要 1.1 tokenizer的训练tokenizer的训练有两种：WordPiece和BPEWordPiece：将所有的「常用字」和「常用词」都存到词表中，需要切词的时候就从词表里面查找即可。（bert就是用该方式做的tokenizer训练）例如：输入句子：你好世界bert就会在词表中找到对应的词：当遇到词表中不存在的字词时，

2025-07-01 17:40:47 1001

原创论文精读-InstructGPT

根据验证集上的RM分数，选择最终的SFT模型。作者发现，训练更多的epochs尽管会产生过拟合，但有助于提高后续步骤的RM分数（这个模型用于后续模型的初始化，而不是直接拿来用，过拟合一点没关系）用强化学习算法PPO，在强化学习中，模型叫做policy，所以文中的RL Policy，其实就是 GPT-3 模型，当policy做了一些action之后（输出Y），环境会发生变化。step3，继续微调前面训练好的SFT，使得其生成的答案能够得到一个尽量高的分数，并将生成的答案放入RM中继续去优化SFT的参数。

2025-06-30 18:00:03 752

原创代码随想录Day14

翻转就是把每个节点的左右孩子交换一下。关键在于遍历的顺序，，在遍历的过程中去翻转每一个节点的左右孩子就可以了，本题可以使用，但是，因为中序遍历会将某些节点的左右孩子翻转两遍。给定一个二叉树，检查它是否是镜像对称的。判断该二叉树是不是对称二叉树的时候，本质上是判断该二叉树的本题遍历只能是“后序遍历”，因为我们要通过来判断两个子树的内侧节点和外侧节点是否相等。给定一个二叉树，找出其最大深度。二叉树的深度为根节点到最远叶子节点的最长路径上的节点数。

2025-06-30 10:57:56 504

原创代码随想录Day13-二叉树

它是一棵空树或它的左右两个子树的高度差的绝对值不超过1，并且左右两个子树都是一棵平衡二叉树。最后一棵不是平衡二叉树，因为它的左右两个子树的高度差的绝对值。前序遍历（中左右）；中序遍历（左中右）；它的左、右子树也分别为二叉排序树。1、确定递归函数的参数和返回值。，则左子树上所有结点的值均。，则右子树上所有结点的值均。3、确定单层递归的逻辑。

2025-06-27 10:10:15 446

原创代码随想录Day11

给定一个数组 nums，有一个大小为 k 的滑动窗口从数组的最左侧移动到数组的最右侧。因为在k个k个的遍历数字到队列中的时候，每次遍历会pop一个和push一个，所以在pop的时候是。，所以将k个中的最大值放在front处可以保证pop出的就是最大值，依次遍历，最后就可以得到最大值的数组。，可以理解为二叉树中的后序遍历，本题可以采用栈来做，根据上述例子21+3*来看，可以将该字符串从。输入: ["2", "1", "+", "3", " * "]的思想，将k个数字放入队列中，并且保证该k个数字中。

2025-06-26 14:07:44 303

原创代码随想录Day10

解释：例如，在 "abbaca" 中，我们可以删除 "bb" 由于两字母相邻且相同，这是此时唯一可以执行删除操作的重复项。之后我们得到字符串 "aaca"，其中又只有 "aa" 可以执行重复项删除操作，所以最后的字符串为 "ca"。进行了相同字符串删除操作后，定义一个空字符串，将栈中的字符依次弹出，但此时弹出字符后的顺序相反，所以还需要进行一下字符串。给定一个只包括 '('，')'，'{'，'}'，'['，']' 的字符串，判断字符串是否有效。stIn为进入的栈，stOut为出去的栈。

2025-06-25 17:55:45 628

原创代码随想录Day09

字符串的右旋转操作是把字符串尾部的若干个字符转移到字符串的前面。给定一个字符串 s 和一个正整数 k，请编写一个函数，将字符串中的后面 k 个字符移到字符串的前面，实现字符串的右旋转操作。思路：本题是反转倒数k个字符，并且将反转后的k个字符移到字符串前面，所以可以先反转整个字符串，反转后，再反转前k个字符，最后反转后面的字符。上述例子-10-1010在冲突的字符前面一个字符a，a处的为1，将1+1=2，所以找下标为2的字符b。-10-1010（将数组整体减一）（2）前后缀不相同，需要注意的是，遇见冲突，

2025-06-25 16:10:46 524

qq_45630686的博客

原创 Transformer详解

原创从0开始训练大模型

原创论文精读-InstructGPT

原创代码随想录Day14

原创代码随想录Day13-二叉树

原创代码随想录Day11

原创代码随想录Day10

原创代码随想录Day09

原创代码随想录day08

原创代码随想录day07

原创代码随想录Day06

原创代码随想录Day4

空空如也

空空如也