项目:https://github.com/GaoPeng97/transformer-xl-chinese
英文的话:https://github.com/kimiyoung/transformer-xl
第一步 先运行起来项目自带案例
看了一下,四个案例中,zhihu是最小的,所以选择zhihu作为代码运行的案例。

按照readme的步骤,查看了里面的参数,没啥好调整的,看到文件路径啥的都写的好好的。

如果是新建,得重新用train,这里看见了文件路径,就修改为zhihu,但等运行代码结束再点运行。


在第504行,用ctrl+F就能找到!
可惜没看懂后面的,tf文件夹里面的readme是个空的,全文的inference我看不懂,文章好多todo,这个项目可能后期再看了。先留着。
本文档介绍了一个基于Transformer-XL的中文模型训练项目。首先,尝试运行项目自带的知乎数据集案例,遵循README步骤,观察并理解代码。尽管项目中有些部分如TF文件夹的readme为空,且存在未完成的部分,但计划后续深入研究。下一步将对代码进行逐行解读,然后利用自己的数据集进行训练,并最终展示训练成果。
1252

被折叠的 条评论
为什么被折叠?



