- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 深度学习的Attention机制,看这一篇文章就够了
Attention 机制的由来与发展看 NLP 方向的论文,几乎每篇都能看到 self-attention、transformer、bert 的出现,如果直接去学习这几个模型的话,很容易迷失在各种矩阵操作中,心里会一直有个疑问,为什么要这么做?但是了解 attention 机制的源头及发展后,心里就慢慢清晰了起来。所以,写这篇文章打算从头梳理一下 attention。机器翻译理论部分在 NLP 中给定一个序列,输出另一个序列的任务,称为 seq2seq,也就是序列到序列的任务。也是机器翻译最常用的模
2022-04-12 15:13:32
605
原创 Viterbi算法原理与实现-通俗易懂
Viterbi算法原理与实现算法原理维特比算法(Viterbi algorithm)是一种动态规划算法,解决的是篱笆型的图的最短路径问题,图的节点按列组织,每列的节点数量可以不一样,每一列的节点只能和相邻列的节点相连,不能跨列相连。如下图,假如你从S和E之间找一条最短的路径,除了遍历完所有路径,还有什么更好的方法?过程非常简单:为了找出S到E之间的最短路径,我们先从S开始从左到右一列一列地来看。首先起点是S,从S到A列的路径有三种可能:S-A1、S-A2、S-A3,如下图:我们不能武断地说
2022-03-29 09:40:36
8310
原创 HMM隐马尔可夫模型-通俗易懂
HMM隐马尔可夫模型在讲HMM(Hidden Markov Model) 之前,应该先搞清楚马尔可夫链,因为 HMM 是根据马尔可夫链建立的一个统计模型,属于马尔可夫链的一种。不太清楚马尔可夫链的,可以看我这篇文章马尔可夫链(Markov Chain)是什么?通俗易懂 - csdn生活化例子直接去看公式的话很难理解 HMM 模型,因为涉及很多专业名词。这里先讲一个 HMM 实例:还是用最经典的例子,掷骰子。假设我手里有三个不同的骰子。第一个骰子是我们平常见的骰子(称这个骰子为D6),6个面,每
2022-03-29 09:07:14
1899
2
原创 马尔可夫链(Markov Chain)是什么?通俗易懂
马尔可夫链(Markov Chain)马尔可夫链经常出现在机器学习的概念中,因为生活中很多情况都可以用马尔可夫链建模,我们先给出数学化的定义,然后再举个生活化的例子与数学公式相对应,就可以理解马尔可夫链了。ps:可以先看生活化的例子,再去看数学公式,更容易理解数学定义马尔可夫链是一组离散随机变量的集合。具体地,给定随机变量集合 X={Xn:n>0}X=\{X_n: n>0\}X={Xn:n>0},若随机变量的取值都在可数集内 X=si,si∈sX=s_{i}, s_{i} \
2022-03-07 16:22:05
19364
8
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人