
深度学习
weixin_41318625
这个作者很懒,什么都没留下…
展开
-
与Bert结构不完全相同的模型从.ckpt 转换为.bin.报错:AttributeError: ‘BertForPreTraining‘ object has noattribute ‘bias“
与Bert结构不完全相同模型 从.ckpt 转换为.bin从tensorflow转换为pytorchAttributeErroor:" BertForPreTraining' object has no attribute “bias“原创 2022-05-04 18:50:56 · 2458 阅读 · 0 评论 -
pytorch -expand/repeat
expand 的参数是扩展后的维度repeat 的参数是每一维扩展的倍数原创 2022-04-02 23:07:45 · 263 阅读 · 0 评论 -
bert 预训练模型的使用(pytorch)
import numpy as npimport torch from transformers import BertTokenizer, BertConfig, BertForMaskedLM, BertForNextSentencePredictionfrom transformers import BertModelmodel_name = 'bert-base-chinese'MODEL_PATH = 'F:/Transformer-Bert/bert-base-chinese/'转载 2022-03-15 14:38:32 · 3891 阅读 · 4 评论 -
PET prompt pattern expoliting traning
https://zhuanlan.zhihu.com/p/462469487转载 2022-02-17 14:20:06 · 208 阅读 · 0 评论 -
fairseq框架下模型训练-train
fairseq训练框架,原代码解析,fairseq的训练过程是如何进行的原创 2022-01-20 16:47:29 · 4137 阅读 · 6 评论 -
fairseq框架下代码分析---模型构建(guided_transformer)
1. 首先定义的类是整个模型的类GuidedTransformerModel(FairseqEncoderDecoderMoel)通过@register的方式注册模型,模型继承FairseqEncoderDecoderModel@register_model("guided_transformer")class GuidedTransformerModel(FairseqEncoderDecoderModel):1)定义init函数 def __init__(self, args, enc原创 2022-01-19 10:31:39 · 4495 阅读 · 2 评论 -
pytorch 读入部分模型权重
https://zhuanlan.zhihu.com/p/363025910转载 2022-01-13 11:15:22 · 185 阅读 · 0 评论 -
Pytorch学习笔记2(fairseq-bert_seq2seq)
fairseq, NLP, pytorch原创 2021-12-23 14:55:14 · 1694 阅读 · 0 评论 -
Residual Learning framework
我们作这样一个假设:假设现有一个比较浅的网络(Shallow Net)已达到了饱和的准确率,这时在它后面再加上几个恒等映射层(Identity mapping,也即 y=x,输出等于输入),这样就增加了网络的深度,并且起码误差不会增加,也即更深的网络不应该带来训练集上误差的上升。而这里提到的使用恒等映射直接将前一层输出传到后面的思想,便是著名深度残差网络 ResNet 的灵感来源。残差网络借鉴了高速网络(Highway Network)的跨层链接思想,但对其进行改进(残差项原本是带权值的,但ResNet用转载 2021-11-28 16:57:09 · 263 阅读 · 0 评论 -
BERT生成词向量
BERT生成的动态词向量和word2vec的词向量的区别:Bert的动态词向量指的是将文本经过Bert处理之后形成的表示。word2vec的词向量是在一个预训练好的词表示矩阵中查某个词的表示向量。区别就在于计算前者的时候需要过一次模型,后者直接检索(look up)参数表就能得到,不需要过模型。细说的话,每个模型都要为所有单词创建一个固定的向量表示(所有单词的表示构成一个矩阵),然后训练时优化它。静态的意思就在这,每个单词的表示是固定的。Bert也有这样的矩阵,所以我们也可以用检索的方式获得Bert.原创 2021-11-27 15:09:14 · 3039 阅读 · 2 评论 -
pytorch 学习笔记1
pytorch 学习笔记unsqueezeunsqueeze可以用来在指定维度上增加一维a1=torch.arange(0,10)print(a1)a2=torch.arange(0,10).unsqueeze(0)print(a2)a3=torch.arange(0,10).unsqueeze(1)print(a3)print(a1.size(),a2.size(),a3.size()#tensor([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])#tensor([原创 2021-11-11 19:37:17 · 1520 阅读 · 0 评论