- 博客(3)
- 收藏
- 关注
原创 Transformer的各个模块
Inputs在字典中找到对应的嵌入表示(batchsize*seqlen*model_dim)词嵌入矩阵需要根据语料库来确定第一个维度(字典里面有多少个词)定义Input Embedding层我们现在确定了字典里面有1000个词;此时batchsize*seqlen*model_dim=2*4*512。
2024-04-27 23:13:45
594
3
原创 pycharm断点调试
3.如果运行到某一行,你想要观察这一行的代码调用的函数中,各种变量都发生了什么变化,则step into 就跳转到我所引用的函数里面去,如果函数中存在子函数,那么不会显示子函数变量的信息,会将子函数执行完以后再返回变量的信息。2.接下来适用step over键,可以逐行运行,观察每一行的代码中数据都发生了什么。5.如果想要跳出函数的话step out。1.设置断点,代码运行到第105行停止。4.接着使用step over逐行跳转。
2023-12-10 11:24:44
427
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人