NLP预训练模型加载工具：Huggingface Transformers

会发paper的学渣

已于 2024-01-17 16:58:44 修改

阅读量552

点赞数 1

分类专栏： NLP 搜索推荐文章标签：自然语言处理人工智能机器学习

于 2021-12-07 17:58:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/sslfk/article/details/121775235

版权

NLP 同时被 3 个专栏收录

29 篇文章

订阅专栏

17 篇文章

订阅专栏

9 篇文章

订阅专栏

NLP对应的算法包括：

分词
词向量
句子向量
命名实体识别
意图识别

预训练的模型内容查看：Models - Hugging Face

transformers工具的简单说明：

Transformers（以往称为 pytorch-transformers 和 pytorch-pretrained-bert）是用于
TensorFlow 2.0 和 PyTorch 的自然语言处理框架。它提供了用于自然语言理解（NLU，Natural Language
Understanding）和自然语言生成（NLG，Natural Language Generation）的最先进的通用架构，包括
BERT、GPT-2、RoBERTa、XLM、DistilBert 与 XLNet 等，具有超过 100 种语言的 32 种以上经过预训练的模型，以及
TensorFlow 2.0 和 PyTorch 之间的深度互操作性。

特性：

与 pytorch-transformers 一样易用
像 Keras 一样强大与简洁
处理 NLU 和 NLG 任务时性能高
教育者和从业者的进入门槛低
低计算成本，研究人员可以共享训练模型，不必再训练，内置 8 种架构，包含 30 多种预训练的模型，其中一些采用 100 多种语言
3 行代码即可训练最先进的模型
TensorFlow 2.0 和 PyTorch 模型之间的深层互操作性，可以随意在两个框架之间移动单个模型

学习开发文档参考：🤗 Transformers

著名网络博主：huggingface-Transformer学习笔记1 - 知乎

masked 多头注意力层：MultiHead-Attention和Masked-Attention的机制和原理_masked multi-head attention-优快云博客

Huggingface Transformers库学习笔记（一）：入门（Get started）_u011426236的博客-优快云博客_huggingface transformers入门

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

会发paper的学渣 您的鼓励和将是我前进的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。