取出BERT中的某一部分网络/参数

小白之比白更白

已于 2022-10-18 10:47:55 修改

阅读量1.1k

点赞数 2

分类专栏：人工智能 python学习 NLP 文章标签： bert 人工智能深度学习

于 2022-10-18 10:45:03 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_41753316/article/details/127383114

版权

今天在写代码的需要提取bert的部分网络或者参数，倒腾了好一会才弄明白。

准备工作

首先还是加载模型：

from transformers import BertTokenizer, BertConfig, BertModel
tokenizer = BertTokenizer.from_pretrained(bert_path)
bert_config = BertConfig.from_pretrained(bert_path)
model = BertModel.from_pretrained(bert_path)

获取某一层的网络

查看所有层

print(model)

会得到这样的结果：

获取网络

然后就需要像俄罗斯套娃一样一层层去获取，比如我想要第一层中attention中output的dense层，那我就可以通过以下指令获取：

model.encoder.layer[0].attention.output.dense

得到结果：

Linear(in_features=768, out_features=768, bias=True)

其他层也是一样的，

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小白之比白更白

关注关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

深入详解自然语言处理（NLP）中的语言模型：BERT、GPT及其他预训练模型的原理与应用

编程技术探索者，分享C/C++、C#、Java、数据库等开发经验，聚焦实战技巧与AI兴趣，助力编程爱好者成长。

01-10

1725

【自然语言处理】——深入详解自然语言处理（NLP）中的语言模型：BERT、GPT及其他预训练模型的原理与应用

从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史

最新发布

m0_73426548的博客

03-25

597

Hugging Face的方法是加载预训练BERT分词器的核心接口，支持多种配置和灵活使用。

tensorflow 获取bert的中间某一层输出的方法

samoyan的博客,记录技术成长~

09-29

2845

在微调bert做微调的时候，想着试一下中间层输出进行分类，以及结合bert某几层的输出做分类。一开始搜索到有博客说使用bert的pytorch版本可以非常容易获取某一层的输出，就想看一下源码里面最后一层 model.get_sequence_output()怎么获取的，发现了是先获取bert每一层的输出，然后取了最后一层。那问题就好弄了，直接使用下面函数获取所有层的输出，然后取某一行进行后续操作即可 all_layer_output=model.get_all_encoder_layers(..

BERT模型的输出

摆渡者

06-14

2万+

0、概述想要获取获取bert模型的输出非常简单，使用 model.get_sequence_output()和model.get_pooled_output() 两个方法，但这两种方法针对NLP的任务需要进行一个选择 1、output_layer = model.get_sequence_output() 这个获取每个token的output 输出[batch_size, seq_length...

pytorch BERT文本分类保姆级教学

nathan_yo的博客

05-18

3172

pytorch BERT文本分类保姆级教学本文主要依赖的工具为huggingface的transformers，更详细的解释可以查阅文档。定义模型模型定义主要是tokenizer、config和model的定义，直接简单粗暴点可以使用huggingface的automodel，这里cache_dir为模型下载的路径，在config中可以定义后面模型要用到的参数，比如我后面model用的是BertForSequenceClassification，需要一个参数来定义模型预测的标签数，所以我在config

基于 BERT 的非结构化领域文本知识抽取

weixin_43961909的博客

07-10

1472

随着知识图谱技术的发展和商业应用的普及，从各类非结构化领域文本中提取出知识图谱实体及关系数据的需求日益增加。这使得针对领域文本的自动化知识抽取颇有意义。本文提出了一种基于 BERT 的知识抽取方法，用于从非结构化的特定领域文本（例如保险行业的保险条款）中自动抽取知识点，以达到在构建知识图谱的过程中节约人力的目的。

BERT模型的实现

Ssucre的博客

12-07

1288

用phytorch实现的一个简单的BERT模型，可以在本地运行。

BERT代码结构

Gu_NN的博客

08-22

1959

目录BertTokenizerBasicTokenizerWordPieceTokenizerBertModelBertEmbeddings类BertEncoder类BertLayerBertAttentionBertSelfAttentionBertSelfOutputBertIntermediateBertOutputBertPooler类基于 Transformers 版本 4.4.2（2021年3月19日发布）项目中pytorch版的BERT相关代码进行分析。 BertTokenizer Bert

关于transformers中bert api结构描述

m0_38043555的博客

11-05

2138

BERT的结构说明关于bert网络结构叙述比较清楚的博客

Tokenizer使用（以BertTokenizer为例）

Blue&boke

06-29

1592

【代码】Tokenizer使用（以BertTokenizer为例）

pytorch 中加载 bert 模型, 获取词向量

znsoft的专栏

08-01

2万+

import torch from transformers import BertTokenizer, BertModel #MODELNAME='hfl/chinese-bert-wwm-ext' #ok #MODELNAME ='hfl/chinese-bert-wwm' #ok #MODELNAME='hfl/rbt3'#ok #MODELNAME='hfl/rbtl3'#ok #MODELNAME='hfl/chinese-roberta-wwm-ext-large' #ok MODELNAME.

Bert实现意图分类

weixin_62791428的博客

11-28

2885

bert模型实现意图分类

Pytorch——BERT 预训练模型及文本分类（情感分类）

ASS-ASH的博客

11-02

4万+

BERT 预训练模型及文本分类介绍如果你关注自然语言处理技术的发展，那你一定听说过 BERT，它的诞生对自然语言处理领域具有着里程碑式的意义。本次试验将介绍 BERT 的模型结构，以及将其应用于文本分类实践。知识点语言模型和词向量 BERT 结构详解 BERT 文本分类 BERT全称为 Bidirectional Encoder Representations from Transformer，是谷歌在 2018 年 10 月发布的语言表示模型。BERT 通过维基百科和书籍语料组成的庞.

bert第三篇：tokenizer

iterate7的博客

10-08

3万+

文章目录tokenizer基本含义bert里涉及的tokenizerBasicTokenzerwordpiecetokenizerFullTokenzierPretrainTokenizer关系图实操如何训练训练自己中文的tokenizer总结引用 tokenizer基本含义 tokenizer就是分词器；只不过在bert里和我们理解的中文分词不太一样，主要不是分词方法的问题，bert里基本都是最大匹配方法。最大的不同在于“词”的理解和定义。比如：中文基本是字为单位。英文则是subword的概念，例

如何查看bert等模型的梯度，用pytorch

为学日益为道日损

10-31

740

print("=============更新之前===========") temp = 0 #控制打印的参数个数 for name, parms in model.named_parameters(): temp += 1 if temp == 2: break print('-->name:', name) print('-->para:', parms) print('-->grad_requirs:', parms.requ.

请使用python写一个bert模型结构？

09-12

请注意，上面的代码仅仅是 BERT 的一部分，要完整地使用 BERT 还需要添加一些其他的层（例如分类层）来进行任务特定的训练和推理。此外，还需要处理输入数据的预处理，例如将文本转换为 BERT 可以处理的形式（即输入...