LLaMA模型指令微调 字节跳动多模态视频大模型 Valley 论文详解
如下图,作者的数据生成piple包含四个步骤:1)生成任务指令,2)确定指令是否代表分类任务,3)使用输入优先或输出优先方法生成实例,4)过滤低质量的数据。然而,这些模型严重依赖于人类编写的指令数据,而这些数据通常在数量、多样性和创造力方面受到限制,因此阻碍了调整模型的通用性。,生成的输入会偏向于某个标签(label),比如是语法错误检测任务,他会生成 语法性的输入。首先生成丰富的指令,初始化175个任务,每个任务1个指令和1个实例;针对每一任务类型,作者独立的生成实例,即整个指令数据。
原创
2023-07-09 16:49:14 ·
1563 阅读 ·
2 评论