期间遇到的问题我来整理一下
- 版本不兼容,注意,我在本机上做实验,用的tf和keras分别是1.40.和2.1.5,在云服务器上一开始爆出了“sofmax的axis的问题,解决方法就是修改版本tf修改为1.4.0keras修改为2.0.8,结果不再报错
我以前的tensorflow版本是1.4.1和keras版本2.1.5。
降级到tensorflow版本1.4.0和keras版本2.0.8。
- PKL文件打开失败,修改下权限就好了”chmod -rmxrmmx issureFile"
- 把模型的输入数据都复制到/input文件夹,"cp空格/data/xxx/mydata.pkl空格/input
- 用GPU训练模型要确保有“tensorflow-gpu"这个模块啊,之前试了多次”CUDA_VISIBLE_DEVICES=0" 都没解决 但学会了查看GPU的指令“nvidia-smi"
- 注意文件的路径,要把程序中涉及到文件读入,和存入的路径,都分别设为”/input/inputdata.pkl"和“/data/xxxx/output_data.xx"