09transformer-xl-chinese项目解读和实践

本文档介绍了一个基于Transformer-XL的中文模型训练项目。首先,尝试运行项目自带的知乎数据集案例,遵循README步骤,观察并理解代码。尽管项目中有些部分如TF文件夹的readme为空,且存在未完成的部分,但计划后续深入研究。下一步将对代码进行逐行解读,然后利用自己的数据集进行训练,并最终展示训练成果。

项目:https://github.com/GaoPeng97/transformer-xl-chinese
英文的话:https://github.com/kimiyoung/transformer-xl

第一步 先运行起来项目自带案例

看了一下,四个案例中,zhihu是最小的,所以选择zhihu作为代码运行的案例。
在这里插入图片描述
按照readme的步骤,查看了里面的参数,没啥好调整的,看到文件路径啥的都写的好好的。
知乎
如果是新建,得重新用train,这里看见了文件路径,就修改为zhihu,但等运行代码结束再点运行。
train
12
在第504行,用ctrl+F就能找到!

可惜没看懂后面的,tf文件夹里面的readme是个空的,全文的inference我看不懂,文章好多todo,这个项目可能后期再看了。先留着。

第二步 逐个代码进行解读

第三步 做自己的数据集和训练

最后一步 成果展示

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值