DataWhale AI 冬令营 定制垂类大模型 = 优质数据集 + 开源大模型(心灵氧吧)

1.1 收集可能的数据集素材

        可以百度自己自己大模型的数据,比如我的心灵氧吧,我就会去找心理治疗的类似对话。

1.2 构建对应格式的数据集

        自己找来的格式不一定是Alpaca或者是ShareGPT,需要修改自己的数据集。像我找的心灵谈话数据集就比较大,一个一个处理比较麻烦,所以我写了一段python代码自动处理。

1.3选择合适的基础模型(maa5平台)

        可以通过不同基础模型来测试那个基础模型对自己的数据集处理能力最强来选择。

1.4 配置微调参数

        参数,在我学的知识中,这种可以调节的参数被称为超参数,对于模型影响的效果不亚于基础模型对结果的影响。所以谨慎的选择适合自己模型的超参数至关重要。

最后

        我想谈谈我做这个垂直模型的初衷,因为我觉得生活中大多数人或多或少都有心理疾病,但是因为成本,或者不希望别人知道等原因不愿意去线下的心理治疗,但是有这个的话就可以帮助到这么一部分人。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值