一些工作记录

代码向:
1. 向量手册数据爬取与清洗:网页爬取数据、对网页数据作清洗
2、事实一致性prompt数据构建:包括query清洗构建、以及prompt生成脚本开发
3、事实一致性训练脏数据的处理:归纳为统一json格式
4、向量化推理服务:协助token处理解析优化
5、plan数据清晰:清晰chatgpt生成的原始数据

大模型数据改写与审核任务:
1、知识场景的RM数据审核-18328条
2、时间推理数据审核
3、诗词数据审核
4、推荐建议数据审核
5、单轮数据撰写以及多轮数据撰写
6、知识检索框架以及大模型微调之后的性能提升数据审核
7、DPO微调方法的性能提升数据审核

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值