初见
- 收获:了解怎么借助星火平台进行一个模型的创建和发布
了解了数据集在训练模型过程中的重要性
- 了解到数据集的格式有多种。比如Alpaca格式、ShareGPT格式等等。
- 这部分中的history字段我有点疑问,这部分跟RNN循环神经网络的输入方式是不是有点像?
- 在这部分我感觉还是挺简单的
对于数据集这部分,如果花些时间自己构建,是不是能够自定义模型的功能了?
现在只了解了一点点,不太清除之后精调模型的操作,所以现在认为数据集的重要性好高啊。
自己的结果
总体的流程走下来了,但是结果好些不太好的样子。
按流程走了两次,但结果都是这样,应该是占比比较少了吧。第二次我训练了15轮,稍微调高了点学习率,但是结果还是这样。
在训练时间上,也是等待时间比较长啊。