自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 NLP方向--Transformer学习记录

一个容易误解的点就是:下意识地认为数据从encoder进decoder出——实际上在模型学习过程中,总要有x(问题)和y(指标)的输入,这样才能让网络在知道问题和答案的情况下推理中间的逻辑过程(参数学习),而实际的输出应该是encoder和decoder交叉注意完最后从softmax输出的logits,它是这个模型最终推理的结果,不过在训练过程中既然知道答案那就输出答案就行了。transformer的重点。在这里除了常见的三角函数编码外,也会有自学习的编码情况,不过固定的三角函数编码已经有良好的表现了。

2024-11-15 15:19:39 583

原创 数据结构期末复习blog

在有向图中,顶点的度等于该顶点的入度与出度之和,顶点v的入度是以v为终点的有向边的条数,记作ID(v),顶点的出度是以v为始点的有向边的条数,记作OD(v)。权和网:在实际应用中,每条边可以标上具有某种含义的数值,该数值称为该边上的权,这些权可以表示从一个顶点到另一个顶点的距离或耗费。连通分量:指的是无向图中的极大连通子图(极大连通子图意思为该子图是G的连通子图,将G的任何不在该子图中的顶点加入,子图不再连通)邻接点:对于无向图G,如果图的边(v, v1)E,则称顶点v和v1互为邻接点,即v和v1相邻接。

2024-01-09 12:00:18 1220

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除