- 博客(13)
- 收藏
- 关注
原创 看懂生成实战
配置环境根据大佬给的requirements的内容,一个一个的pip install这些包太复杂了,就抓住:设置、数据、模型、训练,这几部分。把整体步骤看懂,知道每个文件每个模块是在干嘛就好。主要是问:1.模型是什么?Bart, 为什么用?2.评价指标是什么?CiderD_Score,为什么用?3.输入如何处理的?词表。脱敏的,很多数字都是词表里面没有的,所以把词表改变了。自己知道的内容要往深了广了的说,既占用时间,也让老师知道我了解得深。数据。
2025-02-19 23:19:42
15
原创 Bert和Transformer相关知识点
在计算的时候,会把“跑跑”的(z_2)当作一个常数,也就是不让“追追”从(z_2)那里得到反馈来直接调整自己的猜测,“追追”只能根据之前的经验和计算出来的负余弦相似度,自己去调整如何更好地猜测“跑跑”的图片特征。“追追”会把自己看到的图片(x_1)通过编码器网络(f)处理后,再经过一个预测MLP头(h),得到一个输出向量(p_1),可以把这个(p_1)理解为“追追”对图片特征的一种理解和表达。“追追”会根据自己得到的(p_1)和“跑跑”的(z_2)来做一个对比,对比的方式就是计算它们的负余弦相似度。
2025-02-15 00:06:56
626
原创 三、李哥深度学习——分类任务
在深度神经网络中,随着网络层数的增加,每一层输入的分布会发生变化,这会导致训练过程变得困难,收敛速度变慢,甚至可能出现梯度消失或梯度爆炸等问题。要掌握:半监督学习的原理、数据增强的方法、模型结构的设计、损失函数的选择、训练过程中的细节(如学习率调整、正则化)、如何评估模型性能、以及代码中具体实现的细节(如如何处理无标签数据)S是步长,步长为1,正好符合原来公式。relu比sigmoid更好的防止梯度消失,因为relu的在大于0的部分梯度为1,而sigmoid在大于4小于4后面的梯度为0,很容易梯度消失。
2025-02-14 19:07:41
1703
原创 三、李哥深度学习——一个最简单的神经网络学习项目
5.不用算完 全部数据更新一次loss,太慢了。一个批次计算一次loss,更新一次模型,在再练很多epoch。SGD随机梯度下降,从所有数据里随机取一批进行一次梯度下降。3.技术要点:数据处理,独热编码,正则化,归一化、相关系数,PCA分析、全连接、梯度下降和学习率。超参:不可改的、人为设定的参数。model: 定义自己的模型,即算w和b。1.最麻烦的是数据处理,其他内容有模板套用。data: 一般是文件地址,要提取出X,Y。4.kaggle上看看,尤其是大佬们的心得。2.也是个类,有固定框架。
2025-02-05 15:07:14
226
转载 循环日程表问题
问题描述:循环日程表问题。n=2^k个运动员进行网球循环赛,需要设计比赛日程表。每个选手必须与其他n−1个选手各赛一次;每个选手一天只能赛一次;循环赛一共进行n−1天。按此要求设计一张比赛日程表,该表有n行和n−1列,第i行j列为第i个选手第j天遇到的选手。观察图表可以分为4个部分,用递归分治的方法填充每一部分。#include <iostream>using namespa...
2019-03-05 19:54:27
1508
转载 棋盘覆盖问题
问题描述:在一个2^k * 2^k个方格组成的棋盘中,恰有一个方格与其他方格不同,称该方格为一特殊方格,且称该棋盘为一特殊棋盘。种不同形态的L型骨牌覆盖给定的特殊棋盘上除特殊方格以外的所有方格,且任何2个L型骨牌不得重叠覆盖。这里的前覆盖问题要涉及到分治法;分解 (棋盘切分为4块)-----> 求解(递归每一块有黑块的部分,没有黑块的构造一个) ------> 合并//棋盘覆...
2019-03-05 19:45:50
395
转载 快速幂计算
在这里插入#include &lt;stdio.h&gt;const int N = 100;int x, s[N];bool dfs(int cur, int num, int pre) {//当前深度、最大深度、上次结束后的值 if (cur == num &amp;&amp; pre == x) return true; if (cur &gt;= n...
2019-03-04 22:07:19
297
转载 宝箱
分类枚举的方法,我们可以根据S1和S2的范围大小而采取不同的枚举方法。1.当N/s2(N/s1)的值较小时,枚举s2(s1)的个数2.否则,根据s2v1和s1v2来选择枚举S1或者S2;#include&lt;cstdio&gt;#include&lt;iostream&gt;#include&lt;algorithm&gt;using namespace std;int main
2019-03-04 20:37:52
493
转载 编辑书稿
关于迭代加深和启发式函数的详细解说:https://blog.youkuaiyun.com/flsjzl/article/details/51785488#include&amp;lt;iostream&amp;gt;#include&amp;lt;cstdio&amp;gt;#include&amp;lt;cstring&amp;gt;using namespace std; const int m
2019-03-04 20:20:46
614
转载 万圣节后的早晨
uva1601原文:https://blog.youkuaiyun.com/qq_29169749/article/details/51420097过两天补一下java的和双向的。。#include <iostream>#include <cstdio>#include <queue>#include <cstring>using n...
2019-03-04 19:43:51
437
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人