国家超算互联网「AI跃升季」：谁是下一个“AI”跃人 - AI算力体验活动

本文链接：https://blog.youkuaiyun.com/hahahagehahage/article/details/142886421

活动背景

邀请方：国家超算互联网（www.scnet.cn）

活动名称主题：国家超算互联网「AI跃升季」：谁是下一个“AI”跃人 - AI算力体验活动（https://www.scnet.cn/home/subject/modular/index272.html）

免费领更多算力方式：AI算力不够用？参与谁是下一个“AI”跃人 -AI体验推介活动，赢取千元算力券！（https://www.scnet.cn/home/subject/modular/index270.html）

AI算力性能反馈

运行的商品名称

Llama-2-7b-chat-hf

运行的过程记录

模型微调：

开始训练，为了缩短训练时间这里只微调了attention中Q和V参数
在这里插入图片描述
loraConfig等一些配置

Checkpoint 是 global_step40 时显存状态

Checkpoint 是 global_step160 时显存状态

Checkpoint 是 global_step240 时显存状态

Checkpoint 是 global_step580 时显存状态

使用Nvidia(L20 * 1卡)进行训练

开始训练时间以及显存状态：
在这里插入图片描述
配置与上面的相同，只训练了QV参数，只进行了一轮训练

Checkpoint 是 global_step40 时显存状态

Checkpoint 是 global_step160 时显存状态

Checkpoint 是 global_step240 时显存状态

Checkpoint 是 global_step580 时显存状态
在这里插入图片描述