利用Transformer库搭建情感分析模型

本文介绍了如何利用Transformer库和预训练的BERT模型进行情感分析,包括爬取Yelp评论,将其转化为DataFrame并计算情绪。通过编码、解码和模型预测,得出评论的情感等级。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文讲介绍如何利用Transformer库来快速搭建一个情感分析模型,同时也将利用BeautifulSoup从Yelp中获取评论,以便能够更大规模地计算情绪。

1. 导入依赖库

没有的话请提前安装,安装若有问题可以留言。

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
import requests
from bs4 import BeautifulSoup
import re

2. 初始化模型

这一段代码将从HuggingFace的Transformer库下载预训练好的情感分析模型。
https://huggingface.co/nlptown/bert-base-multilingual-uncased-sentiment
这个预训练模型它以多颗星(1到5颗星之间)预测评论的情绪。

  • Example
tokenizer = AutoTokenizer.from_pretrained('nlptown/bert-base-multilingual-uncased-sentiment')

model = AutoModelForSequenceClassification.from_pretrained('nlptown/bert-base-multilingual-uncased-sentiment')

3. 编码以及计算情绪

tokens = tokenizer.encode('I hated this, absolutely the worst', return_tensors='pt')
  • 可以查看经预训练tokenizer编码之后的句向量
tokens

# tensor([[  101,   151, 39487, 10163, 10372,   117, 35925, 10563, 10103, 43060, 102]])
  • 经预训练tokenizer解码之后的句子包含了[CLS]和<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值