大模型中的常用名词介绍六:【数据与标签】【建议收藏】

本文总结了大模型领域有关【数据与标签】部分的名词,并解释其含义。跳出浩如烟海的大模型知识圈层,从概念上理清大模型的基础脉络!

序号模块分组说明快捷访问
1

模型架构与基础概念

介绍了【模型架构与基础概念】相关的常见名词及含义大模型中的常用名词介绍一:【模型架构与基础概念】【建议收藏】-优快云博客
2训练方法与技术介绍了【训练方法与技术】相关的常见名词及含义大模型中的常用名词介绍二:【训练方法与技术】【建议收藏】-优快云博客
3模型优化与压缩介绍了【模型优化与压缩】相关的常见名词及含义大模型中的常用名词介绍三:【模型优化与压缩】【建议收藏】-优快云博客
4推理与应用介绍了【推理与应用】相关的常见名词及含义大模型中的常用名词介绍四:【推理与应用】【建议收藏】-优快云博客
5计算与性能优化介绍了【计算与性能优化】相关的常见名词及含义大模型中的常用名词介绍五:【计算与性能优化】【建议收藏】-优快云博客
6数据与标签介绍了【数据与标签】相关的常见名词及含义大模型中的常用名词介绍六:【数据与标签】【建议收藏】-优快云博客
7模型评估与调试介绍了【模型评估与调试】相关的常见名词及含义大模型中的常用名词介绍七:【模型评估与调试】【建议收藏】-优快云博客
8特征与数据处理、伦理与公平性等介绍了【特征与数据处理、伦理与公平性等】相关的常见名词及含义大模型中的常用名词介绍八:【特征与数据处理、伦理与公平性等】【建议收藏】-优快云博客

数据清洗(Data Cleaning):处理数据集中的错误、不完整、重复或无关的数据的过程,以提高数据质量和模型性能。

特征工程(Feature Engineering):从原始数据中提取有用的特征,以便更好地训练机器学习模型。这包括特征选择、特征创建和转换等过程。

数据标注(Data Annotation):为训练监督学习模型而对数据进行标记的过程,涉及将类别标签或其他注释附加到数据点上。

数据增强(Data Augmentation):通过生成新的训练样本来增加训练数据的多样性,如图像旋转、缩放等,以提高模型的泛化能力和鲁棒性。

合成数据(Synthetic Data):通过算法生成的人工数据,用于补充或替代真实世界的数据。合成数据可以在数据稀缺、敏感或难以收集的情况下提供帮助,尤其是在需要保护隐私的环境中。它广泛应用于自动驾驶汽车、医疗影像分析等领域,通过模拟不同的场景来扩展训练数据集。

硬标签(Hard Labels):指的是明确的分类标签,通常是单热编码(one-hot encoding)形式,表示样本属于某一特定类别。

软标签(Soft Labels):不同于硬标签的确定性分类,软标签提供了教师模型预测的概率分布,反映了每个类别的可能性。这种方法可以传递更多的信息,例如在知识蒸馏中,使用软标签可以帮助学生模型更好地学习教师模型的知识。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值