微调Llama3模型记录

低级工程师

已于 2024-05-14 17:45:47 修改

阅读量852

点赞数 7

文章标签：人工智能自然语言处理

于 2024-05-14 17:29:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_43384376/article/details/138861159

版权

为了评估llama3模型微调的效果，尝试使用一些特定风格的语料数据微调llama3模型，这里做一下简单记录。

一、模型及数据准备

原生的Meta-Llama-3-8B-Instruct模型对中文效果并不是很好，我这里直接去huggingface上下载的llama3的中文微调版作为原始模型。中文微调版模型在正常的中文对话情景表现明显优于原生llama3，这里想在此基础上进一步微调，使模型在特定语境或者风格下能有预期表现。这里使用的是弱智吧的问答数据进行微调，数据内容如下：

[
  {
    "instruction": "只剩一个心脏了还能活吗？",
    "output": "能，人本来就只有一个心脏。"
  },
  {
    "instruction": "爸爸再婚，我是不是就有了个新娘？",
    "output": "不是的，你有了一个继母。\"新娘\"是指新

最低0.47元/天解锁文章

低级工程师

博客等级

码龄7年

11
原创

138
点赞

204
收藏

221
粉丝

关注

私信

热门文章

最新评论

手部动作识别实践
低级工程师: 关键部分代码都贴出来了
手部动作识别实践
m0_61869108: 作者，您给的代码是全的吗？
【论文复现】WonderWorld：Interactive 3D Scene Generation from a Single Image
低级工程师: 没遇到过，是不是torch版本问题。。
【论文复现】WonderWorld：Interactive 3D Scene Generation from a Single Image
Evelyn2333: CUDA error: invalid configuration argument CUDA kernel errors might be asynchronously reported at some other API call, so the stacktrace below might be incorrect. For debugging consider passing CUDA_LAUNCH_BLOCKING=1 Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions. > /root/WonderWorld/scene/gaussian_model.py(318)create_from_pcd() 317 floater_mask = dist2 > self.floater_dist2_threshold --> 318 print("Floater ratio: {} %".format(floater_mask.float().mean().item()*100)) 319 dist2 = dist2[~floater_mask] 你有报过这个错吗
LangChain学习记录（四）Agent
低级工程师: 不光能搜索呀，整理信息，翻译等等，我这只是冰山一角

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。