bert使用

星星超幸运

于 2023-10-09 11:11:42 发布

阅读量92

点赞数

文章标签： bert 人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wantyingying/article/details/133697415

版权

from transformers import BertModel, BertTokenizer
import torch

tokenizer = BertTokenizer.from_pretrained('./pycharm/K-Adapter/pretrain_bert_en')
model = BertModel.from_pretrained('./pycharm/K-Adapter/pretrain_bert_en')

text = 'I wish you have a good day'

text_ids = tokenizer.encode(text)# 分词+映射，会自动添加[101][102]
print(text_ids)
# [101, 1045, 4299, 2017, 2031, 1037, 2204, 2154, 102]
text_tokenizer = tokenizer.convert_ids_to_tokens(text_ids)
# ['[CLS]', 'i', 'wish', 'you', 'have', 'a', 'good', 'day', '[SEP]']
print(text_tokenizer)
a=torch.tensor(text_ids).unsqueeze(0)   # [1, 9] [bs, seq_len]
print(a.shape)
output = model(torch.tensor(text_ids).unsqueeze(0))
# 包含两项['last_hidden_state', 'pooler_output'] 分别是[1, 9,768] 和 [1, 768]
print(len(output),output.keys())

print(output['last_hidden_state'].shape,output['pooler_output'].shape)

直接使用transformer中实现好的bert就行。关键是预加载模型这里，老是搞半天，这下总归记住了吧。

星星超幸运

博客等级

码龄6年

23
原创

61
点赞

54
收藏

48
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 关于Tokenizer的用法

下一篇：: word文档页码删除问题

最新评论

vscode安装了中文语言不显示
qzynb: thx
怎么看tensor的类型
优快云-Ada助手: 推荐 Python入门技能树：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
linux根据进程PID查询详细进程信息
优快云-Ada助手: 恭喜你写了第18篇博客，标题看起来很有趣味性。我觉得你的博客内容一直很有深度，能够帮助读者解决实际问题。希望你在未来的创作中可以尝试一些更加高级的技巧，或者深入一些特定主题的研究，这样可以让你的博客更加全面，也能够吸引更多的读者。期待你接下来的创作！
关于np.corrcoef
优快云-Ada助手: 推荐 Python入门技能树：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
扩散模型的理解
优快云-Ada助手: 恭喜您写了第19篇博客！能够持续创作并分享您的理解对读者来说是一种福利。对于扩散模型的理解，您可以考虑进一步深入探讨不同类型的扩散模型，或者结合实际案例来分析扩散模型在现实生活中的应用。希望您能继续保持创作的热情，期待您更多的精彩分享！

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。