python小白进化史
文章平均质量分 72
白小白12138
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
机器学习——Random Forest随机森林:b站up主 五分钟机器学习+time星君
(3)假设有M个特征,选择有一部分数据,特征为m(m<<M),每一次分裂都是从m中选一个出来;有很多决策树,不同决策树训练的数据集不一样,看问题的角度不一样,运行结果不一样,将不同结论综合起来,得到随机森林最终的输出。2.对于有不同取值的属性的数据,取值划分较多的属性会对随机森林产生更大的影响,所以随机森林在。征,而是从所有的待选特征中随机选取一定的特征,之后再在随机选取的特征中选取最优的。与数据集的随机选取类似,随机森林中的子树的每一个分裂过程并未用到所有的待选特。,构造子数据集,子数据集的数据量是和。原创 2025-12-23 21:20:04 · 625 阅读 · 0 评论 -
李宏毅:AI AGENT
先获得一个目标(goal),然后观察,根据观察(obs1)进行行动(action1),再观察(obs2),再行动(action2)原创 2025-12-22 15:31:32 · 395 阅读 · 0 评论 -
transformer代码实现——李沐动手学深度学习
ffn_num_input:输入特征的维度(一般是 Transformer 里 attention 的输出维度 d_model)。ffn_num_hiddens:中间隐层的维度(Transformer 原论文里放大 4 倍,例如 512 → 2048)。ffn_num_outputs:输出特征的维度(通常再缩放回 d_model,保持子层输入/输出一致,方便残差连接)。训练结束后,使用Transformer模型将一些英语句子翻译成法语,并计算它们的BLEU分数。暂退法也被作为正则化方法使用。原创 2025-12-09 16:00:17 · 245 阅读 · 0 评论 -
Attention is all you need——论文笔记
在WMT 2014英法翻译任务上,我们的模型在8个GPU上进行了3.5天的培训后,建立了一个新的单一模型最先进的BLEU得分41.8%,成本比之前下降了a small fraction of the training costs of the best models from the literature。关联来自两个任意输入或输出位置的信号所需的操作数量随着位置之间的距离而增加,对于ConvS2S是线性的,对于ByteNet是对数的。它们被连接起来,并再次投影,产生最终的值,如图2所示。原创 2025-12-05 11:30:39 · 1040 阅读 · 0 评论 -
Lessons Learned: A Multi-Agent Framework for Code LLMs to Learn and Improve——阅读论文笔记
我们认为一个团队的agent可以互相学习对方的成功和失败来改善表现。因此,lesson指的是被一个agent创造并且被其他agents传阅在共同解决的过程中。leverages multiple LLM agents without knowing their complementary strengths a priori利用多个LLM代理来解决编码问题,而不需要事先知道它们的互补优势。原创 2025-11-30 20:28:17 · 644 阅读 · 0 评论 -
人工智能自学记录
pytorch接口。# python基础。原创 2025-10-31 10:56:43 · 126 阅读 · 0 评论
分享