BiLSTM-Attention论文笔记

最新推荐文章于 2025-04-16 11:40:48 发布

lzk_nus

最新推荐文章于 2025-04-16 11:40:48 发布

阅读量3.8k

点赞数 1

分类专栏： Deep Learning NLP 文章标签：深度学习人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_42791848/article/details/122420403

版权

BiLSTM-Attention

《Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification》论文笔记

Overview

这篇文章提出了一种特征提取和文本表示的模型。作者提到在文本分类领域，常用的监督学习需要大量的人工标注样本，并且常常需要构建如POS-tagging、NER、dependency parsing等更高级的特征，耗时耗力。为了解决这样的问题，作者提出了这种Attention based的BiLSTM网络，并取得了很好的效果。模型的结构其实很简单，这篇文章也有年头了，但作为之前的经典文章，还是觉得值得复现一下。

Model Structure

模型主要分为五大部分：

Input Layer：输入层
Embedding Layer：词嵌入层，本文使用了词向量
LSTM Layer ：BiLSTM层
Attention Layer ：Attention层
Output Layer：输出层

在这里插入图片描述

LSTM Layer

LSTM层中使用的是双向LSTM，这没什么特别的。值得注意的是，本文的LSTM采用了peephole connection，简单来说就是每个时刻的输入增加了上一时刻的cell state，计算公式稍有变化：
$i_t\ =\ \sigma(W_{xi}x_t+U_{hi}h_{t-1}+V_{ci}c_{t-1}+b_i) \\ f_t\ =\ \sigma(W_{xf}x_t+U_{hf}h_{t-1}+V_{cf}c_{t-1}+b_f) \\ g_t\ =\ tanh(W_{x}x_t+W_{h}h_{t-1}+W_{c}c_{t-1}+b) \\ c_t\ =\ i_tg_t\ +f_tc_{t-1} \\ o_t\ =\ \sigma(W_{xo}x_t+U_{ho}h_{t-1}+V_{co}c_{t-1}+b_o) \\ h_t\ =\ o_ttanh(c_t)$

最低0.47元/天解锁文章

博客等级

码龄7年

81
原创

91
点赞

550
收藏

53
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: match-LSTM论文笔记

下一篇：: CharCNN论文笔记

最新评论

SVM算法详解
lemonade1511: 同问，为什么是1呢，这个不应该是根据间隔的大小定的数字吗
Multi-hop Reading Comprehension through Question Decomposition and Rescoring 论文笔记
卡罗特ok: 解读的很不错！对我很有帮助呀！
Gsum: A General Framework for Guided Neural Abstractive Summarization 论文笔记
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
ELMo算法详解
头等蒜: 感谢分享，讲解得很透彻！
SVM算法详解
arv1nChen: 图6.1下面的公式，为什么是wTx + b >=1 ,y=1 ；而不是 wTx + b >=0，y=1；再或者，不能是2，3，4，5等其他数字呢？为啥是大于等于1？

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。