weixin_42316491-优快云博客

转载源码解读之Pre-train

pre-train是迁移学习的基础，虽然Google已经发布了各种预训练好的模型，而且因为资源消耗巨大，自己再预训练也不现实（在Google Cloud TPU v2 上训练BERT-Base要花费近500刀，耗时达到两周。在GPU上可想而知只会更贵），但是学习bert的预训练方法可以为我们弄懂整个bert的运行流程提供莫大的帮助。预训练涉及到的模块有点多，所以这也将会是一篇长文，在能简略的地方我...

2019-01-15 11:07:08 1051 2

原创跑keras模型涉及到的 keras降级

今天在服务器上跑一个HAN(Hierachical Attention network) 分类模型,使用的keras库,然后报错: TypeError: softmax() got an unexpected keyword argument 'axis'. 这种一般就是库版本的问题,升级了keras,tensorflow之后就可能有问题. 发现 tensorflow...

2018-06-26 17:14:21 4072 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

转载 源码解读之Pre-train

原创 跑keras模型涉及到的 keras降级

空空如也

空空如也

转载源码解读之Pre-train

原创跑keras模型涉及到的 keras降级