为了评估llama3模型微调的效果,尝试使用一些特定风格的语料数据微调llama3模型,这里做一下简单记录。
一、模型及数据准备
原生的Meta-Llama-3-8B-Instruct模型对中文效果并不是很好,我这里直接去huggingface上下载的llama3的中文微调版作为原始模型。中文微调版模型在正常的中文对话情景表现明显优于原生llama3,这里想在此基础上进一步微调,使模型在特定语境或者风格下能有预期表现。这里使用的是弱智吧的问答数据进行微调,数据内容如下:
[
{
"instruction": "只剩一个心脏了还能活吗?",
"output": "能,人本来就只有一个心脏。"
},
{
"instruction": "爸爸再婚,我是不是就有了个新娘?",
"output": "不是的,你有了一个继母。\"新娘\"是指新