文本分类系列(2):TextRNN及其pytorch实现

最新推荐文章于 2025-03-10 12:02:21 发布

BruceWu1234

最新推荐文章于 2025-03-10 12:02:21 发布

阅读量6.4k

点赞数 3

分类专栏：自然语言处理机器学习 pytorch

本文链接：https://blog.youkuaiyun.com/u014514939/article/details/88851958

版权

本文介绍TextRNN在文本分类中的应用，对比TextCNN，强调RNN在捕获长序列及上下文信息方面的优势。通过PyTorch实现了一个双向LSTM模型，并详细解释了其工作原理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文本分类系列(1):TextCNN及其pytorch实现
 文本分类系列(2):TextRNN及其pytorch实现

TextRNN

尽管TextCNN能够在很多任务里面能有不错的表现，但CNN有个最大问题是固定 filter_size 的视野，一方面无法建模更长的序列信息，另一方面 filter_size 的超参调节也很繁琐。CNN本质是做文本的特征表达工作，而自然语言处理中更常用的是递归神经网络（RNN, Recurrent Neural Network），能够更好的表达上下文信息。具体在文本分类任务中，Bi-directional RNN（实际使用的是双向LSTM）从某种意义上可以理解为可以捕获变长且双向的的 “n-gram” 信息。

RNN算是在自然语言处理领域非常标配的一个网络，在序列标注/命名体识别/seq2seq模型等很多场景都有应用，Recurrent Neural Network for Text Classification with Multi-Task Learning文中介绍了RNN用于分类问题的设计，下图LSTM用于网络结构原理示意图，最后一步的隐层代表着对整个句子的编码，直接接全连接层softmax输出。
在这里插入图片描述
pytorch代码实现，具体见github地址

textrnn网络（含具体注释）

import torch
import torch.nn as nn

# 循环神经网络 (many-to-one)
class TextRNN(nn.Module):
    def __init__(self, args):
        super(TextRNN, self).__init__()
        embedding_dim = args.embedding_dim
        label_num = args.label_num
        vocab_size = args.vocab_size
        self.hidden_size = args.hidden_size
        self.layer_num = args.layer_num
        self.bidirectional = args.bidirectional

        self.embedding = nn.Embedding(vocab_size, embedding_dim)
        if args.static:  # 如果使用预训练词向量，则提前加载，当不需要微调时设置freeze为True
            self.embedding = self.embedding.from_pretrained(args.vectors, freeze=not args.fine_tune)

        self.lstm = nn.LSTM(embedding_dim,

最低0.47元/天解锁文章