自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 NLP_基于transformer的翻译

与英语或其他字母语言不同,日语句子不包含空格来分隔单词。我们可以使用JParaCrawl提供的分词器。可以访问JParaCrawl网站来下载它们。

2024-06-30 00:12:20 257

原创 NLP_机器翻译

例如,在输出序列的时间步1,解码器可以主要依赖“They”“are”的信息来生成“Ils”,在时间步2则主要使用来自“watching”的编码信息生成“regardent”,最后在时间步3则直接映射句号“.”。首先,函数𝑎根据解码器在时间步1的隐藏状态和编码器在各个时间步的隐藏状态计算softmax运算的输入。输出层的输出个数为1。以门控循环单元为例,在解码器中我们可以对门控循环单元(GRU)中门控循环单元的设计稍作修改,从而变换上一时间步的输出,隐藏状态,和当前时间步的含注意力机制的背景变量。

2024-06-29 23:59:18 615

原创 NLP_前馈神经网络

在MLP中,许多感知器被分组,以便单个层的输出是一个新的向量,而不是单个输出值。其中X代表输入,W是权重 b是偏置,f是激活函数,权重和偏置是网络从数据中学习,激活函数是在训练前定义,如sigmod、tanh和relu、softmax函数。使用感知机实现简单的二分类任务,是可以实现的,但是感知器的一个历史性的缺点是它不能学习数据中存在的一些非常重要的模式。卷积运算(线性算子)的精确数学表达式对于理解这一节并不重要,但是从这个图中可以直观地看出,核是一个小的方阵,它被系统地应用于输入矩阵的不同位置。

2024-06-29 23:35:13 976

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除