- 博客(7)
- 收藏
- 关注
原创 一些构建模型时总结的经验
如何使用BERT参考这个链接,很详细的一篇入门级将BERT应用于Masked Languaged Model、 Next Sentence Prediction、 Question Answering以及Language Model特殊任务。以及如何使用BERT在没有预训练BERT模型的任务中。https://towardsdatascience.com/how-to-use-bert-from-the-hugging-face-transformer-library-d373a22b0209..
2021-11-04 13:52:32
109
原创 常用函数
torch.norm() 求范数函数,p参数为指明0 1 2范数,dim参数为指明矩阵范数还是矢量范数torch.clamp() 限制张量范围上下限torch.prod(input, dim, keepdim=False, dtype=None) → TensorReturns the product of each row of the input tensor in the given dimension dim.dim 要减少的维度keepdim (bool) – whether the.
2020-08-30 10:12:11
157
原创 常见问题
AttributeError: ‘Tensor’ object has no attribute ‘bool’将.boo() 换成.type(torch.uint8)即可
2020-08-19 09:26:56
145
原创 常用的命令
常用命令删除当前目录所有文件: rm -f *删除目录以a开头的所有文件:rm -rf /home/myuser/a*查找替换:%s/foo/bar/gc查找历史命令: history | grep (python)json文件格式化: %!python -m json.tool杀掉目前hold的所有程序:kill -9 jobs -ps下载google drive files us......
2020-05-05 20:29:49
2005
1
原创 cs224n Lecture6 Language Models and RNNs
CS224n week4N-grams modelPERPLEXITY'S RELATION TO ENTROPYN-grams model针对OOV两种方式稀疏问题:1.分子为0使用Smoothing(discounting)Laplace smoothing(add-1 smoothing):discount dcAdd-k smoothing:2.分母为0...
2020-05-05 14:14:35
229
原创 cs224n lecture7 Vanishing Gradients, Fancy RNNs
RNN’s problemvanishing gradient解决方案:LSTMGRUvsresidual connectionsDenseNetHighwayNetBidirectional RNNsMulti-layer RNNs(stacked RNNs)exploding gradientgradient clippingIn sum...
2020-05-05 12:50:40
174
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人