深度学习
文章平均质量分 92
JJmaker
一点点地成长
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
LSTM 与 GRU
LSTM 全称:Long Short-Term Memory 长短期记忆网络 大致结构如图所示(不想用软件画图。。。): 三个门已经在图中表示了出来。下面将逐步介绍。 图中最上面的C是最主要的传输流。 遗忘门: ft=δ(Wf⋅[ht−1,Xt])f_t = \delta(W_f\cdot[h_{t-1},X_t])ft=δ(Wf⋅[ht−1,Xt])(这里b放入了XtX_tXt中)...原创 2018-11-18 22:55:08 · 326 阅读 · 0 评论 -
bert 原理及源码分析(一)
全称:Bidirectional Encoder Representations from Transformers,即双向 transformer的encoder 表示。 Embedding embedding 由 3 种 embedding 求和而成: Token Embeddings:词向量 Segment Embeddings:句向量 Position Embeddings:位置向量 P...原创 2019-07-28 20:59:36 · 3216 阅读 · 0 评论
分享