微调Llama3模型记录

        为了评估llama3模型微调的效果,尝试使用一些特定风格的语料数据微调llama3模型,这里做一下简单记录。

一、模型及数据准备

        原生的Meta-Llama-3-8B-Instruct模型对中文效果并不是很好,我这里直接去huggingface上下载的llama3的中文微调版作为原始模型。中文微调版模型在正常的中文对话情景表现明显优于原生llama3,这里想在此基础上进一步微调,使模型在特定语境或者风格下能有预期表现。这里使用的是弱智吧的问答数据进行微调,数据内容如下:

[
  {
    "instruction": "只剩一个心脏了还能活吗?",
    "output": "能,人本来就只有一个心脏。"
  },
  {
    "instruction": "爸爸再婚,我是不是就有了个新娘?",
    "output": "不是的,你有了一个继母。\"新娘\"是指新
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值