- 博客(44)
- 收藏
- 关注
原创 机器学习——Random Forest随机森林:b站up主 五分钟机器学习+time星君
(3)假设有M个特征,选择有一部分数据,特征为m(m<<M),每一次分裂都是从m中选一个出来;有很多决策树,不同决策树训练的数据集不一样,看问题的角度不一样,运行结果不一样,将不同结论综合起来,得到随机森林最终的输出。2.对于有不同取值的属性的数据,取值划分较多的属性会对随机森林产生更大的影响,所以随机森林在。征,而是从所有的待选特征中随机选取一定的特征,之后再在随机选取的特征中选取最优的。与数据集的随机选取类似,随机森林中的子树的每一个分裂过程并未用到所有的待选特。,构造子数据集,子数据集的数据量是和。
2025-12-23 21:20:04
378
原创 李宏毅:AI AGENT
先获得一个目标(goal),然后观察,根据观察(obs1)进行行动(action1),再观察(obs2),再行动(action2)
2025-12-22 15:31:32
289
原创 BERT: Pre-training of Deep Bidirectional Transformers forLanguage Understanding——论文笔记
BERT被设计用来无标签文本预训练深度双向表达,通过共同调节所有层中左侧和右侧的上下文。结果是,预训练BERT模型可以被微调仅仅用一个额外的输出层来创造SOTA的模型适用大量的任务,例如问题回答和语言推理,而不需要针对大量任务特定结构微调。
2025-12-14 11:09:26
762
原创 The lllustrated Transformer——阅读笔记
训练时,未经训练的模型照样走一遍 完全一样的前向计算(forward padd)因为我们有标准答案(人工翻译的句子),可以把模型给出的概率分布与正确答案对比,算出损失(loss),然后反向传播更新权重。<eos>是句子结束符)这份“输出词典”是在训练前就建好的,通常是训练集里出现频率最高的 10 000 或 30 000 个词。一旦我们定义输出词典,我们可以使用同一宽度的向量表示单词,这也叫做one-hot encoding。
2025-12-11 11:40:08
684
原创 transformer代码实现——李沐动手学深度学习
ffn_num_input:输入特征的维度(一般是 Transformer 里 attention 的输出维度 d_model)。ffn_num_hiddens:中间隐层的维度(Transformer 原论文里放大 4 倍,例如 512 → 2048)。ffn_num_outputs:输出特征的维度(通常再缩放回 d_model,保持子层输入/输出一致,方便残差连接)。训练结束后,使用Transformer模型将一些英语句子翻译成法语,并计算它们的BLEU分数。暂退法也被作为正则化方法使用。
2025-12-09 16:00:17
237
原创 李宏毅——self-attention Transformer
encoder输出的a1,a2,a3...产生k1,v1,k2,v2,k3,v4,self-attention对应的q,k1q点积产生。在训练阶段用外部知识或先验分布去“告诉”模型的注意力矩阵应该长成什么样,从而加快收敛、提升鲁棒性,或让模型学到人类可解释的对齐方式。Guided Attention = 先验地图 + 辅助损失,让注意力矩阵在训练时就“走对方向”,从而学得更快、更准、更易解释。- **L2** = KL(A‖G) 或 MSE(A,G),直接把 A 拉向先验分布;
2025-12-07 10:41:36
913
原创 Attention is all you need——论文笔记
在WMT 2014英法翻译任务上,我们的模型在8个GPU上进行了3.5天的培训后,建立了一个新的单一模型最先进的BLEU得分41.8%,成本比之前下降了a small fraction of the training costs of the best models from the literature。关联来自两个任意输入或输出位置的信号所需的操作数量随着位置之间的距离而增加,对于ConvS2S是线性的,对于ByteNet是对数的。它们被连接起来,并再次投影,产生最终的值,如图2所示。
2025-12-05 11:30:39
1030
原创 Lessons Learned: A Multi-Agent Framework for Code LLMs to Learn and Improve——阅读论文笔记
我们认为一个团队的agent可以互相学习对方的成功和失败来改善表现。因此,lesson指的是被一个agent创造并且被其他agents传阅在共同解决的过程中。leverages multiple LLM agents without knowing their complementary strengths a priori利用多个LLM代理来解决编码问题,而不需要事先知道它们的互补优势。
2025-11-30 20:28:17
635
原创 7-31 笛卡尔树
注意点:1、二叉搜索树不能通过递归判断,这样只能判断子树是二叉搜索树,不一定整棵树是,应该通过中序遍历判断是否是递增序列。2、注意最小堆的判断,先判断左右子树(如果不为空),再递归。
2023-11-28 16:39:46
463
原创 P1347 排序
1、如果同时有两个度为0的点入队,则条件不足,因为无法确定这两个同时入队的大小关系。3、同时条件矛盾和不足时要输出条件矛盾。2、入队数小于总数,条件矛盾。4、每输入一次判断一次。
2023-10-21 10:01:30
77
原创 厦门大学数据结构实验3.4 【模板】KMP字符串匹配
2、重新开始搜索不要用递归,也不要移动i,直接j=next[j]1、数组要开到1e-6,不然会段错误。
2023-10-19 23:49:18
191
原创 P1807 最长路
1、所以点 1 绝对是一个没有入度的点,而且不会出现环。但是,题目并不保证只有点 11 是没有入度的。他们本身是无法到达的点,所以根本不可能会延伸到其他地方,如果加入队列,那么就会导致个别点,甚至所有点的答案错误。如果不管,那么他们延伸出来的点的入度永远大于 0,因为还有那些点。那么解决方法就是先做一遍 for 循环,找到那些点,再把延伸出来的点的入度 −1,如果这些点入读 −1后又变成了入度为 0的点,那么再做同样的处理。3、读取是注意有可能同一个边有多种权值,要把大的权值输入。
2023-10-18 19:25:06
76
原创 厦门大学数据结构实验2.3 求解迷宫从入口到出口的路径
题目要求先向右、向下、向左、向上的顺序,以及在无法走到终点时输出NO。用flag标记,如果走到flag=1;可以创建数组dx,和dy来进行向上、下、左,右减少代码量。入栈的时机是dfs的开头。
2023-10-10 20:40:43
394
原创 P2058 [NOIP2016 普及组] 海港
1、不是 if(Q[rear].t-Q[front].t>=86400),而是while(Q[rear].t-Q[front].t>=86400)2、while(Q[rear].t-Q[front].t>=86400)的处理应该在读入新数据的前面。因为有可能存在多个值使区间太宽了。
2023-10-08 21:53:15
109
原创 约瑟夫环中的map使用:P1996 约瑟夫问题
要先把it++的位置求出来,再把it2(即原本的it释放掉)2、在把数踢出队列时注意it的处理。1、在循环中注意构造循环的圈。
2023-10-08 20:02:47
104
原创 mooc厦门大学编程实训题集5-1 稀疏矩阵加法
注意事项:注意两个矩阵元素相加抵消的时候也要写index1++,index2++;给定两个矩阵A和B,求其和矩阵C=A+B。
2023-10-06 21:19:29
166
原创 mooc 数据结构与算法题目集7-20 表达式转换&&7-21 求前缀表达式的值
1、注意数字前面有+,-,‘.’要特殊处理。的情况,以及同时有小数点和+的情况。
2023-09-30 20:36:06
108
原创 厦门大学数据结构编程实训题集彩虹瓶PTA
3、在新输入一个数字符合条件之后,index++之后,要判断栈顶的元素是否符合条件,此时要用while而不是if。1、每一次新输入一行都要更新flag,S->top,index。2、栈满的判断是
2023-09-30 11:22:44
260
原创 PTA数据结构与算法题目集7-2 一元多项式的乘法与加法运算
1、注意上下限是多少,我才用的是把全体的指数加1005,此时如果是1000^1000与1000^1000相乘那么上限应该是4010。
2023-09-27 13:30:16
90
1
原创 P3375 【模板】KMP 字符串匹配
4、注意调用index_kmp函数时pos的位置是i-length2+1(即输出的那个数+1,如果下标从0开始就是输出的那个数)3、注意字符串的下标应该从1开始。求next数组时i=1,j=0。1、自己应该要造的测试用例。
2023-09-27 10:46:50
107
1
原创 洛谷P1241 括号序列
2、扫描到左括号入栈(右括号不需要入栈),扫描到右括号与栈顶元素匹配,1、栈存的是下标,这样好标记匹配到的左括号的位置。
2023-09-18 13:27:30
194
原创 (厦门大学数据结构编程实训题集)2-1 最长连续递增子序列错误的点&&2-3 两个有序链表序列的交集错误的点
1、忽略最长递增序列在最后一位,即循环退出后要再考虑一次cnt>max,更新form和last2、last初始值的错误:忽略当只有最长长度为1时last值应该是1,所以初始值last赋为1给定一个顺序存储的线性表,请设计一个算法查找该线性表中最长的连续递增子序列。例如,(1,9,2,5,7,3,4,6,8,0)中最长的递增子序列为(3,4,6,8)。
2023-09-14 18:21:03
205
1
原创 03-树3 Tree Traversals Again
这道题的重点和难点是计算左子树的长度,右子树的长度以及post插入的位置计算这一次我前两者做对了,但是Post插入位置的计算在遍历右子树时把postpos=l1+l2是错的要写成postpos-1附题面push(2);push(3);pop();pop();push(4);pop();pop();push(5);push(6);pop();Figure 1。
2023-09-10 14:45:28
159
1
原创 03-树1 树的同构编程注意事项
要把root1和root2初始化为-1,以及在判断时注意传入参数root1和root2同为-1的情况以及left同为-1,right同为-1给定两棵树T1和T2。如果T1可以通过若干次左右孩子互换就变成T2,则我们称两棵树是“同构”的。例如图1给出的两棵树就是同构的,因为我们把其中一棵树的结点A、B、G的左右孩子互换后,就得到另外一棵树。而图2就不是同构的。现给定两棵树,请你判断它们是否是同构的。
2023-09-10 14:42:04
143
1
原创 哈希表——分离链接法代码书写注意点
2、注意H->TableSize怎么定,在11-散列1 电话聊天狂人中题目输入2n的电话,所以Create函数里用的是2n。3、注意H->Heads[i].Next用的是“.”,而Position p用的是->1、Create函数中要注意malloc H->Heads的空间。代码如上,需要注意的。
2023-09-02 14:02:30
68
原创 11-散列2 Hashing(卡在测试点1和3)
2、判断break的条件是CNum>TableSize。这样的话当CNum=TableSize时。1、当msize=1是对应的素数是2。
2023-08-31 10:53:27
76
原创 ERROR:Process exited after 2.687 seconds with return value 3221226356
检查后发现是H->Heads=(List)malloc(sizeof(struct TblNode)*(H->TableSize));应该改成H->Heads=(List)malloc(sizeof(struct VNode)*(H->TableSize));常见的错误可能是malloc错误或者L本身是空指针但是访问L->Next。原代码如下,一直发现不到问题。
2023-08-30 16:44:08
2880
1
原创 C语言[Error] expected ‘,‘ or ‘...‘ before ‘new‘
C语言中new是关键字,所以不能以new为变量名。
2023-08-30 13:54:41
761
1
原创 最近写“图”的代码经常犯的错误
用邻接表存储图时用到BuildGraph函数记得要返回MGraph,否则编译时不会犯错,但是运行窗口会显示越界。
2023-08-29 15:47:02
75
1
原创 Mooc06-图3 六度空间
如图所示,刚开始last=1,V=1,进入for循环之后满足last==v,则把last更新成第一层(红色一圈)的最后一个即为7,同时level++。后面while循环继续运行,v不断更新=2,3,4,5,6,7当v=7时满足last==v再次更新last,level++if(v==last) //如果出队的这个元素等于我们设置的last。//last指向上一层的最后一个元素。不太明白以下这部分是怎么运行的,回去看了mooc的讲解终于懂啦。
2023-08-25 21:27:03
64
1
空空如也
PAT Judge 1和4测试点一直过不了.求解答
2023-08-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅