笔记总结:
了解大模型的发展方向、本质、以及新一代数据清洗过滤技术、从模型到应用的典型流程、获取数据集的网站、不同微调方式的使用场景和训练数据是什么,以及预训练和微调在训练优势、通信/计算调度、显存管理上的区别。
收获:
理清了预训练和微调的区别,两者在什么情况下进行。针对我们的业务仍然要基于行业垂直领域进行续训,同时要考虑如何筛选高质量语料数据。
下节课前准备:
提前看一下一期课程,了解大概需要做什么,同时补充一些相关论文阅读。



本文概述了大模型的发展趋势,重点讲解了预训练和微调的区别及其适用场景,强调了在行业垂直领域的定制化微调和数据筛选的重要性。作者还提示了下节课的准备工作,包括回顾上一课内容和阅读相关论文。
笔记总结:
了解大模型的发展方向、本质、以及新一代数据清洗过滤技术、从模型到应用的典型流程、获取数据集的网站、不同微调方式的使用场景和训练数据是什么,以及预训练和微调在训练优势、通信/计算调度、显存管理上的区别。
收获:
理清了预训练和微调的区别,两者在什么情况下进行。针对我们的业务仍然要基于行业垂直领域进行续训,同时要考虑如何筛选高质量语料数据。
下节课前准备:
提前看一下一期课程,了解大概需要做什么,同时补充一些相关论文阅读。




被折叠的 条评论
为什么被折叠?