基于Transformer模型+强化学习训练的立直麻将agent
此项目刚开始不久,欢迎提PR,欢迎交流讨论
权重、数据集未公开
How to use Satori
运行tests/run_test.py
,令OP=2
,修改gd = GameData(...)
的参数可指定手牌、场况等信息
例如对于手牌6678m3445p4567s44z, dora=2z
,给出$\pi(s)$如下:
How to generate your dataset
- 从 tenhou 网站 上下载日志文件包,放在
SL/logs/
文件夹下 - 运行
SL/spider.py
,会自动解析logs文件并将记载对局信息的.json
文件存储到SL/games/
文件夹下 - 运行
SL/game_loa