
计算机技术
wzlearning
这个作者很懒,什么都没留下…
展开
-
bert模型部分代码记录
bert源码理论有很多,核心结构应该是transformer代码部分,如下。bert的transformer结构用了多层。初始层的输入张量是字符embedding与位置embedding,后面的n层输入张量是前一层的输出张量,中间有存储注意力层的输出张量。存储的注意力层输出张量会做拼接,输出给下面的ln和dense,产生当前层的输出张量。原创 2022-12-21 18:01:58 · 434 阅读 · 1 评论 -
pycharm 远程连接服务器,出现connect failed现象
pycharm,远程连接服务器,出错原创 2022-09-07 15:55:11 · 2894 阅读 · 0 评论